2026년 6월 18일 목요일
오늘의 신문
2026년 6월 18일 목요일 오늘의 신문
구글 AI 연구팀이 Gemini 모델을 활용해 비정형 글로벌 뉴스에서 구조화된 역사 데이터를 추출하는 새로운 방법론 ‘Groundsource’를 발표했다. 이 프로젝트는 급작스러운 자연재해에 대한 역사 데이터 부족 문제를 해결하는 데 목적이 있다.
2026년 3월 13일 오전 4시 07분
에밀 마이클은 우버에서의 논란을 겪은 인물로, 트럼프 행정부에서 군사 인공지능 활용 문제를 담당하며 앤트로픽과 대립하고 있다.
2026년 3월 13일 오전 3시 23분
우버에서 여러 논란을 겪은 에밀 마이클이 트럼프 행정부에서 인공지능의 군사적 활용 문제를 담당하는 핵심 인물로 활동하고 있다.
2026년 3월 13일 오전 3시 23분
틱톡 모회사 바이트댄스가 엔비디아의 최상위 AI 칩에 접근할 수 있게 되면서 구글, 오픈AI 등과 경쟁하기 위한 AI 애플리케이션 개발에 박차를 가하고 있다.
2026년 3월 13일 오전 3시 00분
우크라이나 국방부는 인공지능의 표적 인식 능력 향상을 위해 전장 드론 영상을 인공지능 모델 훈련에 활용할 계획이라고 밝혔다. 윤리적 우려에도 러시아와의 경쟁을 위해 필요하다고 설명했다.
2026년 3월 12일 오후 9시 41분
이 튜토리얼에서는 Andrej Karpathy가 제안한 AutoResearch 프레임워크를 구글 콜랩에 맞게 구현하는 방법을 소개합니다. 자동화된 실험 파이프라인을 구축해 하이퍼파라미터 조정과 실험 추적을 자동으로 수행합니다.
2026년 3월 12일 오후 6시 46분
스탠퍼드 대학 연구진이 기기 내에서 완전히 작동하는 개인 AI 에이전트를 개발할 수 있는 오픈소스 프레임워크 'OpenJarvis'를 발표했다. 이 플랫폼은 로컬 우선 AI 시스템 구축을 위한 연구 및 배포용 인프라를 제공한다.
2026년 3월 12일 오후 5시 21분
구글이 인공지능을 활용해 급격한 홍수를 추적하는 새로운 도구를 선보였다. 이 기술은 변덕스러운 강우를 예측하는 데 중점을 둔 최신 인공지능 기상 모니터링 투자 중 하나다.
2026년 3월 12일 오후 1시 00분
아마존 노바 모델과 오픈서치 서비스를 활용해 대규모 영상 데이터셋에서 자연어 검색이 가능한 멀티모달 영상 검색 시스템 구축 방법을 소개한다. 수동 태깅과 키워드 검색을 넘어 영상 콘텐츠의 의미를 포괄하는 시맨틱 검색이 가능하다.
2026년 3월 12일 오전 11시 59분AWS Blog
인공지능 요원 시대에 있어서 실리콘밸리 프로그래머들은 이제 거의 프로그래밍을 하지 않고, 대신 깊고 이상한 일을 하고 있다.
2026년 3월 12일 오전 8시 53분
MS NOW 앵커 크리스 헤이즈는 민주당이 아직도 자신들의 비전을 명확히 표현하지 못하고 있다고 말했다.
2026년 3월 12일 오전 8시 25분
LiTo는 객체의 3D 형상과 시점에 따른 외관을 동시에 모델링하는 새로운 3D 잠재 표현 방식을 제안한다. 기존 연구들이 형상 재구성이나 시점 독립적 확산 외관 예측에 집중한 반면, LiTo는 시점 의존적 효과를 효과적으로 포착한다.
2026년 3월 12일 오전 12시 00분Apple
Agentic AI 시스템은 인간 중간 관리자들과 같은 비효율성에 취약하며, 많은 효율성을 목표로 하는 AI가 없애려는 비효율성을 재현한다. 특히 연속적으로 작업할 때 최악의 결정을 내린다.
2026년 3월 11일 오후 2시 46분Genetic Engineering and Biotechnology News
NVIDIA가 Nemotron 3 Super를 공개했다. 이 모델은 복잡한 다중 에이전트 응용 프로그램을 위해 설계된 놀라운 1200억 파라미터 추론 모델로, 경쟁 모델보다 5배 높은 처리량을 제공한다.
2026년 3월 11일 오후 2시 19분
AI 배우 틸리 노우드가 1년 전 할리우드를 충격에 빠뜨렸지만, 최근 공개한 뮤직비디오는 AI가 인간 배우를 대체할 수 없다는 점을 보여줬다.
2026년 3월 11일 오전 10시 00분
구글이 Gemini Embedding 2를 발표했다. 이 모델은 텍스트 뿐만 아니라 이미지, 비디오, 오디오, 문서 등을 임베딩 공간으로 가져와 AI 개발자가 고차원 저장 및 교차 모달 검색 도전에 대처할 수 있도록 설계되었다.
2026년 3월 11일 오전 3시 18분

최신뉴스 전체보기

GPZ: 대규모 입자 데이터를 위한 차세대 GPU 가속 손실 압축기

입자 기반 시뮬레이션과 포인트 클라우드 응용 프로그램은 과학 및 상업 데이터 집합의 크기와 복잡성을 대규모로 확장시키고 있으며, 이를 효율적으로 축소, 저장 및 분석하는 것은 현대 GPU의 병목 현상을 방지하는 것이다. 이는 우주학, 지질학과 같은 분야에서 신흥 대규모 도전 과제 중 하나이다.

2025년 8월 24일 오전 1시 57분
인텔의 몰락이 보여주는 거대기업도 사라질 수 있다는 것

실리콘밸리 칩 제조업체의 아이콘에서 트럼프 행정부에 10% 지분을 판매함으로써, 기술계의 최강자조차 쇠퇴할 수 있다는 사실을 강조한다.

2025년 8월 23일 오전 10시 29분
구글, 트럼프 행정부와 합의한 AI 연방 기관들을 위한 폭스 뉴스 AI 뉴스레터

최신 AI 기술 발전에 대해 최신 정보를 받아보고, AI가 현재와 미래에 제공하는 도전과 기회에 대해 알아보세요.

2025년 8월 23일 오전 9시 00분
금융 기관을 위한 대형 언어 모델 LLM 대 소형 언어 모델 SLM: 2025년 실용적 기업 AI 안내서

2025년에는 대형 언어 모델(LLMs)과 소형 언어 모델(SLMs) 사이에 절대적인 승자가 없다. 은행, 보험사 및 자산 관리자들은 규제 리스크, 데이터 민감성, 대기 시간 및 비용 요구 사항, 사용 복잡성에 따라 선택해야 한다.

2025년 8월 23일 오전 5시 22분
AI의 유리 천장을 깨려는 전 여성 해커 하우스

샌프란시스코의 글렌 파크 지역에 위치한 FoundHer House는 모두 여성 구성원으로 구성된 특별한 해커 하우스로, 주거민들은 자신들의 스타트업을 세우기 위해 서로 지원하는 커뮤니티를 형성하고 있습니다.

2025년 8월 23일 오전 5시 01분
Huawei CloudMatrix: 확장 가능하고 효율적인 LLM 서빙을 위한 P2P AI 데이터센터 아키텍처

LLM은 파라미터 수가 급증하고 MoE 디자인과 대규모 컨텍스트 길이의 널리 사용으로 급속히 발전했습니다. DeepSeek-R1, LLaMA-4, Qwen-3 같은 모델은 이제 수조 개의 파라미터에 이르며 엄청난 컴퓨팅, 메모리 대역폭, 빠른 칩 간 통신이 요구됩니다. MoE는 효율성을 향상시키지만 전문가 라우팅에서 도전을 야기하며 백만 개 이상의 토큰을 갖는 컨텍스트 창은 […]

2025년 8월 22일 오후 6시 48분
NVIDIA, 중국을 위한 새로운 칩 제작 중

NVIDIA의 CEO 제인슨 황은 중국 기업에 더 강력한 칩을 판매할 것을 계획 중이라며 트럼프 행정부에 허가를 요청할 예정.

2025년 8월 22일 오후 2시 46분
아마존 베드락 기능으로 지리적 분석 및 GIS 워크플로우 향상

아마존 베드락을 활용하여 기존 시스템을 통합하고 효율적인 인사이트를 얻기 위한 새로운 워크플로우를 만들 수 있습니다. 이 통합은 기술, 비기술, 리더십 역할에 모두 이점을 줄 수 있습니다.

2025년 8월 22일 오후 1시 54분AWS Blog
우주에서의 줄기세포와 나노입자 및 펩타이드 설계를 위한 AI

이번 GENTouching Base 에피소드에서는 국제 우주 정거장에 보관된 냉동 줄기세포와 도전적인 대상을 위한 혁신적인 나노입자 및 펩타이드 설계를 위한 AI 모델에 대해 논의합니다.

2025년 8월 22일 오전 11시 41분Genetic Engineering and Biotechnology News
아마추어 복원가가 인공지능 혁신으로 미술계를 뒤흔들다

알렉스 카키네는 일상에서 마이크로칩 연구에 종사하며, 의외로 복원에 필요한 기술 세트를 가지고 있다.

2025년 8월 22일 오전 5시 02분
Zhipu AI, 컴퓨터 사용 에이전트를 위한 엔드투엔드 강화학습 확장 AI 프레임워크 ComputerRL 공개

Zhipu AI가 ComputerRL을 소개했다. 본 프레임워크는 에이전트에게 복잡한 디지털 작업 환경을 탐색하고 조작할 능력을 부여하는 것을 목표로 한다. 이 혁신은 AI 에이전트 개발에서 핵심적인 도전 과제를 해결하는데, 즉 컴퓨터 에이전트와 인간이 디자인한 GUI 간의 연결 부재를 해소한다.

2025년 8월 22일 오전 4시 14분
SlowFast-LLaVA-1.5: 비디오 이해를 위한 토큰 효율적인 비디오 대형 언어 모델 패밀리

SF-LLaVA-1.5는 비디오 이해를 위한 효율적인 모델로, 작은 규모의 Video LLMs도 최첨단 성능을 달성할 수 있다는 것을 보여줌.

2025년 8월 22일 오전 12시 00분Apple
체크리스트는 보상 모델보다 언어 모델을 정렬하는 데 더 나은 방법입니다

언어 모델은 사용자 지시를 이해하고 따라야 합니다. 저자들은 보상 모델 대신 유연한, 지시별 기준을 제안하며, “체크리스트 피드백에서 강화 학습”을 제안합니다. 이를 통해 강화 학습이 지시 따르기에 미치는 영향을 확대할 수 있습니다.

2025년 8월 22일 오전 12시 00분Apple
오픈AI GPT-OSS 모델을 아마존 세이지메이커 하이퍼팟 레시피를 사용하여 세밀하게 조정하기

아마존 세이지메이커를 사용하여 GPT-OSS 모델을 세밀하게 조정하는 방법에 대한 시리즈 중 두 번째 포스팅이다. 이번 글에서는 오픈 소스 허깅페이스 라이브러리를 이용해 GPT-OSS 모델을 세밀하게 조정하는 방법을 다룬다.

2025년 8월 21일 오후 5시 35분AWS Blog
스피커 다이어라이제이션이란? 2025 기술 가이드: 2025년 최고의 9가지 스피커 다이어라이제이션 라이브러리 및 API

스피커 다이어라이제이션은 오디오 스트림을 화자 식별로 분리하여 각 세그먼트를 일관되게 레이블링하는 프로세스로, 통역을 더 명확하고 검색 가능하며 콜센터, 법률, 의료, 미디어, 대화형 AI 등 다양한 분야에서 유용하게 활용된다. 2025년 현재 현대 시스템들이 활발히 사용되고 있다.

2025년 8월 21일 오후 4시 24분
AI 도구가 의사들의 대장암 진달력을 약화시킬 수 있다는 연구 제안

인공지능이 대장경 검사에서 사용될 경우 의사들의 종양 발견 능력을 약화시킬 수 있다는 의료 전문가들의 경고.

2025년 8월 21일 오전 10시 52분
Meta AI 문서 노출, 챗봇이 어린이들과 유희하기 허용

Meta AI 내부 문서가 노출되어 회사가 Reuters에 의해 폭로될 때까지 챗봇이 어린이들과 유희하고 로맨틱 대화를 나누는 것을 허용했다.

2025년 8월 21일 오전 10시 05분
OpenAI, ChatGPT의 역할을 정신 건강 돕기로 제한

OpenAI는 ChatGPT가 해로운 또는 잘못된 응답을 제공한 사례 이후, 새로운 규칙에 따라 직접적인 정신 건강 상담을 피하도록 합니다.

2025년 8월 21일 오전 9시 53분
투자자들, 나스닥 주식과 파월 연설에 대한 기대

다음 주 Nvidia가 실적을 발표하면, 투자자들은 연방준비제도 의장의 연설보다 S&P 500 지수가 더 큰 반응을 보일 것으로 예상하고 있다.

2025년 8월 21일 오전 5시 03분
대형 언어 모델의 행동을 결정할 수 있는 단일 파라미터의 역할

Apple 연구원들의 논문에 따르면, 대형 언어 모델에서 매우 작은 파라미터 하위 집합이 (경우에 따라 단일 파라미터) 전체 기능에 지나치게 큰 영향을 미칠 수 있다. 이 연구는 이러한 “슈퍼 가중치”와 이에 상응하는 “슈퍼 활성화”의 중요성을 강조하며, 효율적인 모델 압축을 위한 새로운 통찰을 제공한다.

2025년 8월 21일 오전 12시 00분Apple
2025년 PyTorch 대 TensorFlow: 심층학습 프레임워크 대결

2025년 현재 인공지능 개발에서 PyTorch와 TensorFlow 사이의 선택은 여전히 가장 논란이 되는 문제 중 하나이다. Alfaisal 대학의 종합 조사 논문을 통해 최신 동향을 탐색하며 사용성, 성능, 배포, 생태계 고려 사항을 종합적으로 분석한다.

2025년 8월 20일 오후 7시 34분
아마존 SageMaker AI와 모델 컨텍스트 프로토콜(MCP)을 활용하여 예측적 머신러닝 모델을 이용해 AI 에이전트 향상시키기

이 포스트에서는 아마존 SageMaker AI와 MCP를 활용하여 예측적 머신러닝 모델을 통합하여 AI 에이전트의 능력을 향상하는 방법을 소개합니다. Strands Agents SDK와 SageMaker AI의 유연한 배포 옵션을 사용하여, 개발자들은 대화형 AI를 강력한 예측 분석 기능과 결합한 고급 AI 애플리케이션을 만들 수 있습니다.

2025년 8월 20일 오후 4시 26분AWS Blog
인공지능이 세상을 바꿀 수 있지만 완전히 새롭게 만들진 않을 것

인공지능은 세상을 바꿀 수 있지만 완전히 새롭게 만들지는 않을 것으로 보인다.

2025년 8월 20일 오후 3시 01분
디지털 트윈이 생산원가를 줄이고 바이오파마 시장 확대에 도움

바이오파마 산업에서 엔지니어들은 디지털 트윈을 활용하여 프로세스에 변화하는 입력과 조건이 어떻게 영향을 미치는지 평가하고, 생산량을 최적화하고 폐기물을 줄이며 생산원가를 낮추는 것을 목표로 합니다.

2025년 8월 20일 오후 12시 00분Genetic Engineering and Biotechnology News
데이터와 AI를 활용하여 디지털을 넘어선 생물공정 혁신

생물공정 정상회담에서 Sanofi의 Cenk Undey 박사가 청중에게 “디지털을 넘어선 미래”를 모색하도록 도전했습니다.

2025년 8월 20일 오전 10시 10분Genetic Engineering and Biotechnology News
NASA, IBM의 ‘뜨거운’ 새로운 AI 모델이 태양의 비밀 해제

NASA는 IBM과 협력하여 개발한 Surya 헬리오물리 기초 모델을 출시했다. 이는 NASA의 Solar Dynamics Observatory에서 14년간의 관측을 기반으로 한 인공지능 모델로, AI의 발전을 활용하여 방대한 양의 태양 데이터를 분석한다.

2025년 8월 20일 오전 9시 03분
에이미 클로부차: 인공지능 딥페이크가 문제라는 건 알고 있었지만, 나 자신의 딥페이크를 보고 나서야…

클로부차 상원의원은 딥페이크가 점점 현실적으로 나타나고 막기 어려워지고 있다고 경고하며, 의회가 지금 조치를 취해야 한다고 강조했다.

2025년 8월 20일 오전 9시 00분
신호와 소음: 더 나은 AI 결정을 위한 신뢰할 수 있는 LLM 평가를 해제

대형 언어 모델(Large Language Models, LLMs)을 평가하는 것은 과학적으로나 경제적으로 비용이 많이 든다. LLMs의 크기가 점점 커지면서 이를 평가하고 비교하는 방법론은 점점 중요해지고 있다. Allen Institute for Artificial Intelligence (Ai2)의 최근 연구는 두 가지 기본 요소를 중심으로 한 강력한 프레임워크를 소개했다.

2025년 8월 20일 오전 3시 09분
Ollama, REST API 및 Gradio 채팅 인터페이스를 활용한 완전한 Self-Hosted LLM Workflow 구축의 코딩 구현

본 튜토리얼에서는 Google Colab 내에 완전한 Ollama 환경을 구현하여 Self-Hosted LLM Workflow를 복제하는 방법을 제시한다. Colab VM에 공식 Linux 설치 프로그램을 사용하여 Ollama를 설치하고 localhost:11434에 HTTP API를 노출시키는 과정부터 시작하여 Ollama 서버를 배경에서 실행한다. 서비스를 확인한 후, […]

2025년 8월 20일 오전 12시 04분
새로운 소재를 위한 ‘산업화의 계곡’을 메울 수 있는 인공지능

AI가 소재 합성, 특성 분석, 모델링에 도입되면 새로운 통찰을 얻고 기술을 빠르게 시장에 내놓을 수 있게 도와줄 것으로 전문가들이 예상하고 모인다.

2025년 8월 19일 오후 11시 46분
오픈AI의 GPT-5 출시로 냉소적인 반응에 대한 반발

오픈AI가 ChatGPT의 새 버전을 출시했을 때 사람들은 냉소적인 응답을 이유로 반발했다. 이에 회사는 챗봇과의 감정적 연결을 인정하며 신속히 후퇴했다.

2025년 8월 19일 오후 4시 54분
메타의 인공지능 노력 재편, 재정비한 후 다시 진행

메타가 내부적으로 인공지능 부문의 새로운 구조조정을 발표했으며, 기술에 대한 내부적인 긴장으로 인해 이에 대한 사람들의 지식을 통해 밝혀졌다.

2025년 8월 19일 오후 3시 46분
오픈AI 직원 주식 판매, ChatGPT 제작사 가치 5000억 달러로 평가

오픈AI의 가치가 5000억 달러로 세계에서 가장 가치 있는 비상장 기업이 될 전망이다.

2025년 8월 19일 오후 2시 16분
AI & 전기: 두 관점

인공지능 혁명을 지켜보며 데이터 센터용 전기가 어디서 나올지와 얼마나 비용이 들지에 대한 의문이 제기되고 있다.

2025년 8월 19일 오전 10시 55분
VantAI, Halda Therapeutics가 10억 달러 이상 근접 기반 치료 협력을 시작합니다

VantAI는 Neo-1 기반 모델을 활용하여 새로운 맥락별 타겟-효과자 쌍을 식별하고 유효성을 검증하여, 암 및 면역 질환 지표에 피드백을 제공할 것입니다.

2025년 8월 19일 오전 9시 13분Genetic Engineering and Biotechnology News
분자가 다른 용매에서 어떻게 용해될지 예측하는 새로운 모델

이 모델은 용해도 예측을 통해 새로운 약을 설계하고 합성할 때 더 위험한 용매 사용을 최소화하는 데 도움을 줄 수 있습니다.

2025년 8월 19일 오전 5시 00분MIT News
Qwen Team이 Qwen-Image-Edit를 소개: 시맨틱 및 외관 편집을 위한 고급 기능을 갖춘 Qwen-Image의 이미지 편집 버전

2025년 8월 알리바바의 Qwen Team이 출시한 Qwen-Image-Edit는 20B-파라미터 Qwen-Image를 기반으로 고급 편집 기능을 제공한다. 이 모델은 시맨틱 편집(스타일 전이 및 새로운 시각 합성)과 외관 편집에서 뛰어나다.

2025년 8월 18일 오후 7시 17분
단백질 언어 모델 내부 작동 공개

연구진들은 인공지능 모델이 어떤 특징을 활용해 약물이나 백신의 대상이 될 수 있는 단백질을 예측하는지 밝히는 새로운 방법을 개발했다.

2025년 8월 18일 오후 3시 00분MIT News
COMET의 로켓 속도: AI가 디자인한 나노입자가 mRNA 치료를 가속화시킴

AI 모델이 최적의 성분 혼합물로 구성된 리피드 나노입자를 개발하여 RNA 백신 및 다른 유형의 RNA 치료물질을 더 효율적으로 전달할 수 있게 함.

2025년 8월 18일 오전 8시 00분Genetic Engineering and Biotechnology News
트럼프가 인공지능을 자유롭게 운용하길 원해. 이것이 그를 막을지도 몰라.

미국 대통령이 미국의 인공지능 기업들을 세계에 풀어놓길 원하지만, 유럽은 그의 방해요인이 될 수 있다.

2025년 8월 18일 오전 2시 28분
AI 추론이란 무엇인가? 기술적인 심층 탐구 및 2025년 판매자 상위 9곳

2025년을 기준으로 AI 추론에 대한 기술적인 심층 탐구를 제공하며, 모델 훈련과 실제 응용 프로그램 간의 연결을 담당하는 추론의 핵심 기능에 대해 다룹니다. 현대 모델의 지연 문제와 최적화 전략과 같은 주제를 다룹니다.

2025년 8월 18일 오전 1시 55분
대용량 언어 모델에서 핵심 참조 해결에서의 확신 격차를 활용한 교차적 편향 조사

대용량 언어 모델은 인상적인 성능을 달성했지만, 사회적 편견을 반영하고 악화시킬 수 있다는 과학적 합의가 있음. 이 연구에서는 확신 격차를 사용하여 LLMs의 교차적 편향을 조사함.

2025년 8월 18일 오전 12시 00분Apple
Hugging Face, AI Sheets 공개: LLM-Powered 데이터셋을 위한 무료 오픈소스 노코드 툴킷

Hugging Face사가 AI Sheets를 출시했는데, 이는 무료이자 오픈소스이며 로컬 기반의 노코드 툴로, AI를 활용한 데이터셋 생성과 보강을 혁신적으로 간소화하는 데 목적이 있다. AI Sheets는 직관적인 스프레드시트 인터페이스를 대표하는 오픈소스 대형 언어 모델(Qwen, Kimi, Llama 3 등)과 직접적으로 결합하여 AI 기반 데이터 처리에 대한 접근성을 민주화하고 있다.

2025년 8월 17일 오후 4시 06분
이전 워싱턴포스트 사실 검증자가 ‘부재주인’ 베조스를 비판하며, 종이를 구원할 것이라고 약속하거나 팔라고 요구합니다

전 워싱턴포스트 사실 검증자인 글렌 케슬러는 폭스 뉴스 디지털과의 인터뷰에서 뉴스 사이트가 “길을 잃었다”고 말하며 제프 베조스와 신문의 최고 경영진을 비판했습니다.

2025년 8월 17일 오후 4시 00분
뉴욕 시니어 스토어에서 주목받는 안드로이드 로봇

중국 제조사인 Unitree R1 로봇이 맨해튼 거리를 걸어다니며 KraneShares의 2800만 달러 AI 로봇 펀드 홍보 캠페인의 일환으로 신발 쇼핑을 했다.

2025년 8월 17일 오전 6시 00분
Duolingo의 CEO가 AI에 대해 대화하고 싶어합니다

1억명 이상의 사용자를 보유한 이 언어 학습 앱은 인공지능을 수용했지만 소비자로부터 반발을 겪고 있습니다.

2025년 8월 17일 오전 5시 00분
Dagster를 활용한 머신러닝 통합 엔드 투 엔드 파티션 데이터 파이프라인 구축 및 유효성 검사를 위한 코딩 가이드

이 튜토리얼에서는 Dagster를 사용하여 고급 데이터 파이프라인을 구현한다. 맞춤형 CSV 기반 IOManager를 설정하여 자산을 보존하고, 분할된 일일 데이터 생성을 정의하며, 합성 판매 데이터를 클리닝, 피처 엔지니어링 및 모델 트레이닝을 통해 처리한다. 중간에 데이터 품질 자산 확인을 추가하여 널 값, 범위 및 범주 값 등을 유효성 검사한다.

2025년 8월 17일 오전 1시 35분
dots.ocr 만나보기: 다국어 문서 구문 분석에서 최고 수준의 성능을 달성한 새로운 1.7B 비전-언어 모델

dots.ocr은 다국어 문서 레이아웃 구문 분석과 광학 문자 인식(OCR)을 위해 개발된 오픈 소스 비전-언어 트랜스포머 모델이다. 이 모델은 단일 아키텍처 내에서 레이아웃 감지와 내용 인식을 수행하며 100여 개 언어와 다양한 구조화된 및 비구조화된 문서 유형을 지원한다.

2025년 8월 16일 오후 1시 22분
기업인들이 그들의 회사에 AI를 도입하기를 원하지만, 그들 스스로는 이해하고 있는 건가요?

일부 기업인들은 미래의 기술을 사용하는 방법을 배우도록 유도당하고 있습니다. C-급 임원 회의에는 AI 도구를 사용한 웹사이트 구축이 의무화되고 있습니다.

2025년 8월 16일 오전 5시 00분
NVIDIA AI, 유럽어용 최대 규모 오픈소스 음성 AI 데이터셋과 첨단 모델 공개

NVIDIA가 유럽어용 Granary라는 최대 규모의 오픈소스 음성 데이터셋과 Canary-1b-v2, Parakeet-tdt-0.6b-v3 두 첨단 모델을 발표했다. 이는 특히 소수 언어에 대한 자동 음성 인식 및 음성 번역 분야에서 액세스 가능하고 고품질의 자원에 새 기준을 제시한다.

2025년 8월 16일 오전 1시 29분
Salesforce AI가 Moirai 2.0를 발표: Salesforce의 최신 타임 시리즈 기반 모델은 디코더 전용 트랜스포머 아키텍처로 구축되었습니다

Salesforce AI Research가 Moirai 2.0을 공개했다. 이는 타임 시리즈 기반 모델의 최신 진보로, 디코더 전용 트랜스포머 아키텍처 위에 구축되어 성능과 효율성에서 새로운 기준을 세우며 GIFT-Eval 벤치마크에서 1위를 차지했다.

2025년 8월 15일 오후 4시 27분
아마존 베드락 에이전트코어 게이트웨이 소개: 기업용 AI 에이전트 도구 개발 혁신

아마존 베드락 에이전트코어 게이트웨이는 기업이 AI 에이전트와 도구 및 서비스를 연결하는 방식을 혁신적으로 변화시키는 완전히 관리되는 서비스로, 에이전트-도구 소통을 위한 통합 인터페이스를 제공한다. 보안 가드, 번역, 구성, 대상 확장성, 인프라 관리자, 의미론적 도구 선택과 같은 주요 기능을 제공하며, 양방향 보안 아키텍처를 구현하여 수신 및 발신 연결에 고급 보안을 제공한다.

2025년 8월 15일 오후 2시 04분AWS Blog
구글 AI 이메일 요약문이 해킹되어 피싱 공격을 숨길 수 있다

구글 워크스페이스 Gemini AI의 보안 취약점으로 사이버 범죄자들이 현재 보호 방법을 우회하는 가시적 명령을 사용하여 이메일 요약을 조작할 수 있게 되었습니다.

2025년 8월 15일 오전 10시 00분
AI가 운영하는 음식점에서 식사를 하시겠습니까?

두바이의 Woohoo 레스토랑은 AI 시스템 셰프 Aiman을 특징으로 하며, 버려진 재료와 잘라낸 부분으로 새로운 요리를 만들어 부양물을 줄입니다.

2025년 8월 15일 오전 6시 00분
주식 시장이 무서워지고 있습니다. 당신이 해야 할 일은 무엇인가요?

주식 시장이 지나치게 달아오르고 있는 것 같은 걱정스러운 징후들이 있습니다.

2025년 8월 15일 오전 5시 01분
스탭 인형인 동시에 AI 챗봇

3세 이상 어린이들을 위한 새로운 종류의 애착 인형이 출시되었는데, 화면 시간 대안 및 부모의 주의를 대체하기 위한 것이다.

2025년 8월 15일 오전 5시 01분
AI가 RNA 백신 및 기타 RNA 요법 개발 가속화하는 방법

MIT 엔지니어들은 기계 학습 모델을 사용하여 세포로 효율적으로 RNA를 전달할 수 있는 나노입자를 설계했다.

2025년 8월 15일 오전 5시 00분MIT News
Dynamic Fine-Tuning (DFT): 지도된 미세 조정(SFT)의 일반화 간격을 줄이는 방법

지도된 미세 조정(SFT)은 LLMs를 새로운 작업에 적응시키는 표준 기술이지만, 종종 강화 학습(RL)에 비해 일반화에서 성능이 저하됩니다. DFT는 이 간극을 줄이는 새로운 방법을 제안합니다.

2025년 8월 15일 오전 3시 17분
사전 훈련된 자동 음성 인식의 성능 개선을 위한 Pitch Accent 감지

세미-지도 음성 표현을 이용하는 자동 음성 인식(ASR) 시스템의 성능을 향상시키기 위해 ASR 및 Pitch Accent 감지 모델을 소개한다. 모델의 Pitch Accent 감지 구성 요소는 과제의 최신 기술에 대해 F1 점수 갭을 41%로 줄이는 중요한 개선을 달성한다. 또한, ASR 성능이 한정된 자원 미세 조정 하에 LibriSpeech에서 WER을 28.3% 감소시킨다. 이러한 결과로 사전 훈련을 확장하는 중요성을 입증한다.

2025년 8월 15일 오전 12시 00분Apple
Misty: 상호작용적 개념 혼합을 통한 UI 프로토타이핑

Misty는 UI 프로토타이핑을 위해 새로운 개념적 혼합 기술을 소개하는데, 이는 디자인 예시에서 다양한 측면을 빠르게 통합할 수 있는 혁신적인 UI 워크플로우를 제공한다. 14명의 프론트엔드 개발자를 대상으로 한 탐색적 사용 연구를 통해 Misty의 효과를 평가하고 이에 대한 피드백을 수집했으며, 결과는 Misty가 효과적임을 시사한다.

2025년 8월 15일 오전 12시 00분Apple
기기 지향적 음성 감지를 위한 적응형 지식 증류

기기 지향적 음성 감지(DDSD)는 사용자의 음성 어시스턴트(VA)에 대한 쿼리를 배경 음성이나 부수적인 대화와 분리하는 이진 분류 작업이다. 이를 위해, ASR 대규모 사전 훈련된 음향 인코더(교사)의 일반적인 표현으로부터 지식을 전달하는 새로운 적응형 KD 방법을 제안한다. 이를 통해 DDSD 정확도를 향상시키고 효율적인 배포를 보장한다.

2025년 8월 8일 오전 12시 00분Apple
HuBERT 자가 지도 학습 목표로 DiceHuBERT 압축하기

DiceHuBERT는 HuBERT를 압축하기 위한 지식 증류 프레임워크로, 기존의 층별 및 특징별 매핑을 사용하는 방법과 달리 HuBERT의 자체 증류 메커니즘을 활용하여 원래 모델을 학생 모델로 직접 대체함으로써 학생이 HuBERT 사전 훈련시 사용된 동일한 자가 지도 학습 목표를 사용하여 학습되도록 함.

2025년 8월 8일 오전 12시 00분Apple
NVIDIA XGBoost 3.0: Grace Hopper Superchip로 테라바이트 규모 데이터셋 학습

NVIDIA는 XGBoost 3.0을 발표했는데, 이제 1개의 GH200 Grace Hopper Superchip에서 기가바이트부터 1테라바이트(TB)까지의 그래디언트 부스팅 결정 트리 (GBDT) 모델을 학습할 수 있다. 이 혁신은 회사들이 사기 탐지, 신용 위험 모델링, 알고리즘 거래와 같은 애플리케이션을 위해 거대한 데이터셋을 처리할 수 있게 해준다.

2025년 8월 7일 오후 9시 22분
오픈에이아이, 챗지피티 사용자들에게 GPT-5 새 인공지능 모델 공개

오픈에이아이는 새로운 주력 기술인 GPT-5를 발표했다. 이 모델은 빠르고 정확하며 허구를 만들 가능성이 적다.

2025년 8월 7일 오후 1시 00분
아마존 베드락으로 구동되는 DIVA 물류 에이전트

DTDC와 ShellKode가 아마존 베드락을 활용하여 제너레이티브 인공지능(AI)을 기반으로 한 DIVA 2.0 물류 에이전트를 구축한 과정에 대해 소개합니다.

2025년 8월 7일 오후 12시 44분AWS Blog
아마존 베드락이 AWS에서 차세대 계정 계획을 지원하는 방법

아마존 베드락을 활용해 계정 계획 프로세스를 간소화하고 향상시킨 Account Plan Pulse를 소개합니다. Pulse는 검토 시간을 줄이고 협업과 소비를 위해 실질적인 계정 계획 요약을 제공하여 AWS 영업팀이 고객에게 더 나은 서비스를 제공할 수 있게 도와줍니다.

2025년 8월 7일 오전 9시 56분AWS Blog
MoE 아키텍처 비교: Qwen3 30B-A3B vs. GPT-OSS 20B

이 기사는 최근 출시된 두 Mixture-of-Experts (MoE) 트랜스포머 모델인 알리바바의 Qwen3 30B-A3B와 OpenAI의 GPT-OSS 20B를 기술적으로 비교한다. 두 모델은 MoE 아키텍처 설계에 대해 다른 접근을 취하며, 계산 효율성과 성능을 다양한 배포 시나리오에서 균형있게 유지한다.

2025년 8월 7일 오전 1시 02분
차량 배출량을 크게 줄일 수 있는 생태 운전 방법

교차로에서 교통을 완화하기 위해 차량 속도를 자동으로 제어하는 새로운 연구 결과, 탄소 배출량을 11 ~ 22% 줄일 수 있다.

2025년 8월 7일 오전 12시 00분MIT News
실리콘밸리의 기술 종교의 부상

인공지능의 위험에 초점을 맞춘 Rationalists 커뮤니티가 기술인들과 다른 유사한 사람들과 함께 도시 한 블록을 차지하는 복합체에서 정기적으로 모임을 가진다.

2025년 8월 6일 오후 8시 03분
건축 및 계획 학부, 2025년을 위해 새로운 교수진 영입

MIT의 건축학과 및 미디어랩에 네 명의 새로운 교수가 합류했다.

2025년 8월 6일 오후 4시 10분MIT News
중국, 인공지능으로 정보전쟁에 나서

중국 한 기업이 미 의회 의원 등 영향력 있는 미국인들의 데이터를 수집한 것으로 밝혀졌다.

2025년 8월 6일 오후 12시 33분
산오피, 디지털 의약품 제조에 전력

산오피는 AI가 제조 과정에서 더 중요한 역할을 할 것으로 예상하며, 디지턈 팀을 설립하는 등 디지털 의약품 제조에 집중하고 있다.

2025년 8월 6일 오후 12시 00분Genetic Engineering and Biotechnology News
트럼프 행정부, OpenAI와 협력하여 연방 정부에 인공지능 투입

GSA는 OpenAI와 파트너십 발표, ChatGPT를 연방 직원에 저렴한 비용으로 도입하여 트럼프 행정부의 글로벌 AI 경쟁 우승 목표 지원.

2025년 8월 6일 오전 9시 29분
C3: 복잡한 구두 대화 모델링을 위한 이중 언어 벤치마크 데이터셋 및 평가 프레임워크 소개하는 AI 논문

본문에서는 중국에서 나온 새로운 연구 논문을 소개하며, 구두 대화 모델의 실제 대화 복잡성을 다루는 능력을 평가하는 것이 중요한 도전이라고 설명하고 있다.

2025년 8월 6일 오전 5시 15분
AI 혁명과 함께 하는 데이터 저장소 지원

MIT 동문이 공동 창업한 Cloudian의 저장 시스템은 기업이 대규모로 데이터를 제공하는 AI 모델과 에이전트를 지원하고 있다.

2025년 8월 6일 오전 12시 00분MIT News
노인 미국인들, AI 파워 된 챗봇으로 공감 찾아

75세 미국 미망인 Jill Smola는 하루 최대 5시간을 AI 기반 챗봇 동반자와 대화하는 것으로 나타났다.

2025년 8월 5일 오후 8시 11분
오픈AI, ChatGPT 뒤에 있는 일부 A.I. 시스템 오픈소스화 예정

OpenAI가 큰 전환을 통해 두 개의 A.I. 시스템을 오픈소스로 공개하고 외부 연구원과 기업들과 기술을 자유롭게 공유할 계획이다.

2025년 8월 5일 오후 3시 27분
구글과 메타 같은 기술 기업들이 군사 산업을 수용하는 방법

구글, 오픈AI, 메타 등 기술 기업과 벤처 캐피탈리스트들이 군사 산업에 참여하기로 한 주요 변화가 있었다. 이들은 이전에 전쟁 참여를 거부했던 많은 기업들이다.

2025년 8월 5일 오후 3시 16분
Genie 3: 월드 모델의 새로운 지평

Genie 3는 720p 해상도에서 24프레임 속도로 실시간으로 항해할 수 있는 동적 세계를 생성할 수 있으며, 몇 분 동안 일관성을 유지합니다.

2025년 8월 5일 오전 10시 00분Deep Mind
AI, 공개 과학 및 차세대 치료제로 말라리아 저항 대응

여덟 전문가가 협력 전략과 기술적 혁신을 논의하며 말라리아 약물 개발의 미래를 모색하는 GEN 웨비나.

2025년 8월 5일 오전 9시 54분Genetic Engineering and Biotechnology News
A.I. 홍보시대가 도래했고, 미국은 반드시 대응해야 합니다

GoLaxy가 기술적으로 발전된 국가 쟁점을 가진 영향력 캠페인의 선두주자로 부상함을 보여주는 문서들이 있다.

2025년 8월 5일 오전 7시 18분
구글 AI가 LangExtract를 공개: 비구조화 텍스트 문서에서 구조화된 데이터 추출하는 오픈 소스 파이썬 라이브러리

LangExtract는 구글 AI의 새로운 오픈 소스 파이썬 라이브러리로, 비구조화된 텍스트 문서에서 의미 있는 정보를 추출하는 것을 목표로 한다. 이 라이브러리는 Gemini와 같은 LLMs를 사용하여 이러한 과제를 직접 해결한다.

2025년 8월 5일 오전 1시 49분
NASA, 지구 관측과 원격 감지를 발전시키는 오픈 소스 멀티모달 모델 ‘갈릴레오’ 공개

NASA가 개발한 오픈 소스 멀티모달 모델 ‘갈릴레오’는 다양한 지구 관측 데이터를 처리, 분석, 이해하는 데 활용되며, 광학, 레이더, 해발, 기후, 보조지도 등을 대규모로 처리하는 데 사용된다. McGill 대학, NASA Harvest Ai2, Carleton 대학, British Columbia 대학, Vector Institute, Arizona 주립 대학 등의 연구진의 지원을 받아 개발되었다.

2025년 8월 4일 오후 6시 55분
샌프란시스코 인공지능 붐의 내부 가이드

샌프란시스코는 메타와 구글과 같은 기업이 위치한 곳으로, 인공지능 산업의 중심지이다.

2025년 8월 4일 오후 5시 02분
샌프란시스코 AI 붐에 몰리는 20대 CEO들

M.I.T., Georgetown, Stanford 출신들과 대학을 가지 않은 이들이 자신들만의 인공지능 스타트업을 만들기 위해 기다릴 여유가 없다고 말하며 모여 샌프란시스코의 AI 산업에 진출하고 있다.

2025년 8월 4일 오후 4시 57분
MIT 도구가 “물리적으로 불가능한” 물체를 시각화하고 편집

MIT의 “Meschers” 도구는 2.5차원에서 에셔(Escher)와 유사한 광학적 환영을 시각화하여, 물리적으로 불가능한 모양을 이해하고 새로운 디자인을 도와줄 수 있습니다.

2025년 8월 4일 오후 4시 40분MIT News
AI로 생성된 오지 오즈본 헌정 노래에 대해 팬들의 의견이 분분

오지 오즈본의 사망 이후, 80세의 롯 스튜어트가 그의 공연 중 늦은 록 전설을 위해 고전 히트곡 “Forever Young”을 헌정하고 있다. 이에 대한 팬들의 반응은 분분하다.

2025년 8월 4일 오전 10시 42분
AI 현상 해체

미국 정부는 AI 경쟁에서 승리하려 하지만, 아직까지 AI의 실제 기능과 위험에 대해 명확히 이해하고 있지 않다. AI에 대한 오해와 현실에 대한 분석이 필요하다.

2025년 8월 4일 오전 10시 27분
트럼프, ‘오웰리언’ 유럽 검열에 반발하며 AI 활용 노력 고조

트럼프 행정부는 유럽의 기술 규제를 검열로 비판하며, 이념적 편향을 방지하기 위한 규제 완화에 초점을 맞춘 새로운 AI 계획을 공개했다.

2025년 8월 4일 오전 9시 05분
시스템 업그레이드

실리콘밸리의 새로운 분위기를 탐구한다.

2025년 8월 4일 오전 7시 03분
인공지능이 초래한 실리콘밸리 ‘하드 테크’ 시대

인공지능이 소비자 웹사이트와 모바일 앱의 시대에 작별을 고하고, 실리콘밸리는 “하드 테크”로 불리는 새로운 시대를 열었다.

2025년 8월 4일 오전 5시 00분
SHAP-IQ 시각화 탐색하는 튜토리얼

이 튜토리얼에서는 머신러닝 모델이 예측에 도달하는 방법에 대한 통찰을 제공하는 SHAP-IQ 시각화 범위를 탐색합니다. 이러한 시각화는 복잡한 모델 동작을 해석 가능한 구성 요소로 분해하여 각 특정 예측에 대한 기능의 개별 및 상호 작용적인 기여를 확인하는 데 도움을 줍니다.

2025년 8월 4일 오전 12시 45분
웨이브폼 도메인 신경망을 활용한 앰비소닉 슈퍼-해상도

한글

2025년 8월 4일 오전 12시 00분Apple
AI/ML을 위한 CPU, GPU, NPU, TPU의 궁극적인 가이드: 성능, 사용 사례 및 주요 차이점

AI와 기계 학습 워크로드는 전통적인 CPU가 제공하는 것 이상의 계산 가속화를 촉진하여 특화된 하드웨어의 발전을 이끌었습니다. 각각의 처리 장치인 CPU, GPU, NPU, TPU는 AI 생태계에서 특정 모델, 응용 프로그램 또는 환경에 최적화되어 독특한 역할을 합니다. 이들의 주요 차이와 최상의 사용 사례에 대한 기술적이고 데이터 주도적인 분석을 제공합니다.

2025년 8월 3일 오전 6시 38분
Roboflow 감독을 활용한 엔드 투 엔드 객체 추적 및 분석 시스템 구축

Roboflow 감독 라이브러리를 활용하여 객체 감지 파이프라인을 구축하는 고급 튜토리얼. 실시간 객체 추적 설정, 감지 부드럽게 처리, 비디오 스트림에서 특정 지역을 모니터링하기 위해 다각형 영역 정의 등을 다룸. 프레임을 처리하면서 경계 상자, 객체 ID 등을 주석으로 달아줌.

2025년 8월 3일 오전 5시 22분
구글 AI, MLE-STAR 발표: 다양한 AI 작업 자동화 가능한 최첨단 기계 학습 엔지니어링 에이전트

MLE-STAR은 구글 클라우드 연구원들이 개발한 최첨단 에이전트 시스템으로, 복잡한 기계 학습 ML 파이프라인 설계와 최적화를 자동화합니다. MLE-STAR은 웹 규모 검색, 특정 코드 수정, 견고한 검사 모듈을 활용하여 기계 학습 엔지니어링 작업에서 우수한 성능을 발휘합니다.

2025년 8월 2일 오후 11시 20분
MIT 연구진, 증명 가능한 Lipschitz 경계 및 뮤온으로 트랜스포머 민감도 제어 방법 개발

MIT 연구진은 대규모 트랜스포머를 안정적으로 훈련하는 것이 어려운 문제를 해결하기 위해 불안정한 활성화 및 손실 증폭을 줄이기 위해 증명 가능한 Lipschitz 경계를 강제하는 방법을 개발했다.

2025년 8월 2일 오후 4시 54분
SHAP-IQ 패키지를 활용하여 머신러닝 모델에서 Shapley 상호작용 지수(SII)를 사용해 특성 상호작용 발견과 시각화하는 방법

SHAP-IQ 패키지를 사용하여 Shapley Interaction Indices (SII)를 통해 머신러닝 모델의 특성 상호작용을 발견하고 시각화하는 방법을 탐구하는 튜토리얼. Shapley values는 AI 모델의 개별 특성 기여를 설명하는 데 효과적이지만 특성 상호작용을 포착하지 못하는데, 이를 보완하는 방법을 다룸.

2025년 8월 2일 오후 4시 33분
Trackio 만나보기: 머신 러닝 워크플로우를 간소화하고 향상시키는 무료 지역 우선 오픈 소스 실험 추적기 파이썬 라이브러리

Trackio는 머신 러닝 워크플로우에서 중요한 실험 추적을 간편하고 통찰력 있게 만들어주는 파이썬 라이브러리다. 다양한 실험 추적 솔루션들과는 달리 복잡한 설정이 필요 없으며 라이선스 비용도 없다. 사용자 데이터를 소유권이 있는 프로토콜에 가둬두지 않는다.

2025년 8월 2일 오전 3시 47분
할리우드, 영화 매력을 바꾸는 AI 도구에 주목

최신 Generative A.I. 기술이 영화 산업을 선도하며, 많은 스튜디오들이 은화면을 비롯한 효과 제작을 간소화하기 위해 활용하고 있다.

2025년 8월 1일 오후 6시 52분