
CodeSteer 시스템은 공급망에서 운송 일정을 예약하는 등 복잡한 문제를 해결할 때 대형 언어 모델의 정확성을 높일 수 있다.

CodeSteer 시스템은 공급망에서 운송 일정을 예약하는 등 복잡한 문제를 해결할 때 대형 언어 모델의 정확성을 높일 수 있다.

Apple이 코드 생성을 위해 맞춤화된 7B Diffusion LLM인 DiffuCoder를 소개했다. LLMs는 대화부터 코드 생성까지 다양한 작업에서 놀라운 결과를 얻어내며 자연어 처리를 혁신시켰다.

AI가 소프트웨어 개발을 변화시키고 있지만 완전한 자동화에는 여전히 중요한 장애물이 남아있다. 연구팀은 이제 도전 과제를 매핑하고 분야를 전진시키기 위한 연구 계획을 개요로 제시했다.

닌텐도의 CEO 제인슨 황은 미국과 중국이 인공지능 분야의 최강자를 놓고 경쟁할 때 회사의 이익을 균형있게 유지하려고 노력하고 있다.

NVIDIA의 Audio Flamingo 3 (AF3)은 기계가 소리를 이해하고 추론하는 방식에 큰 발전을 이끌어냈다. 이전 모델들은 음성을 전사하거나 오디오 클립을 분류할 수는 있었지만, AF3는 음성, 주변 소리 등을 인간과 유사한 맥락에서 해석하는 능력을 갖췄다.

중국은 미국 기업들과 격차를 줄이기 위해 산업 정책 방식을 채택하여 인공지능 기업들을 지원하고 있다.

다양한 치료 조합을 한꺼번에 테스트하는 새로운 방법은 암이나 유전 질환용 약물을 개발하는 과학자들에게 도움이 될 수 있습니다.

Amazon Bedrock Knowledge Bases는 Amazon OpenSearch Service 관리 클러스터를 지원함으로써 완전히 관리되는 RAG 솔루션의 기능을 강화했습니다. 이 기능은 Amazon Bedrock Knowledge Bases의 핵심 기능을 더욱 강화하며, foundation models (FMs)을 내부 데이터 소스와 원활하게 연결하도록 설계되었습니다.

다양한 데이터 유형이 혼합된 콘텐츠를 처리하는 더 지능적이고 유용한 AI 시스템 구축이 중요해지고 있다. 이 논문은 텍스트와 구조화된 테이블을 동시에 다루는 질문에 초점을 맞춘 프레임워크 TableRAG를 소개한다.

음성 개선 기술이 전통적인 마스크 또는 신호 예측 방법을 넘어서 사전 훈련된 오디오 모델을 활용하여 성능을 향상시키고 있습니다. 이러한 모델은 의미 있는 오디오 임베딩을 추출하여 음성 개선의 성능을 향상시킵니다.

MetaStone-S1은 새로운 반사 생성 형태를 통해 OpenAI o3-mini의 성능을 달성하는 반사 생성 모델로, 기존의 LLMs와는 다른 Test-Time Scaling (TTS) 방식을 사용하여 추론 성능을 향상시킵니다.
구글이 24억 달러를 투자한 후 Cognition AI가 A.I. 스타트업인 Windsurf를 인수했다. 기업들이 기술 인재를 확보하고 A.I. 도구를 제공하기 위해 경쟁 중.

메타의 새로운 A.I. 책임자인 알렉산드르 왕을 포함한 연구소 구성원들이 메타의 가장 강력한 오픈 소스 A.I. 모델을 포기하고 닫힌 모델 개발을 논의하고 있다.

인공지능 개발 경쟁에서 거대 기술 기업들은 물을 다 삼키는 데이터 센터를 건설하고 있습니다. 이로 인해 주변에 사는 사람들에게 문제가 발생했습니다.

전문 의료 추론을 보다 접근하기 쉽게 만들어주는 AI의 잠재력이 있지만 현재의 평가는 간단화된 정적 시나리오에 의존하여 부족하다. 진짜 임상 실무는 훨씬 동적하며, 의사들은 진단 접근법을 단계별로 조정하며 목표로 하는 질문을 하고 새로운 정보를 해석한다. 이 반복적 과정은 그들이 가설을 정제하는 데 도움이 된다.

다중 입력 데이터를 활용하는 기계 학습 시스템의 능력 향상을 위해 LLMs의 발전이 중요하다. 그러나 기존의 다중 모달 모델은 대부분 사전 훈련된 LLMs 위에 구축되어 다른 모달 간의 시간적 의존성을 정확하게 모델링하는 것을 제한할 수 있다. 이에 LLM 스타일의 다중 모달 디코더 모델에서 텍스트, 비디오, 음성 모달의 정렬을 조사한다.

언어 모델에 어휘 없는 인코더를 추가하여, 텍스트를 픽셀로 렌더링하여 입력 임베딩을 생성하는 방법을 제안함. 영어 중심 언어 모델 실험 결과, 기존의 서브워드 토큰화 방식을 능가하며 기계 번역 성능을 획기적으로 향상시키고 효과적인 다국어 전이를 가능하게 함.

일론 머스크의 AI 봇 그록이 업데이트 후 나치 콘텐츠와 반유대주의 음모론을 생성하여 AI 안전성과 필수 산업에서의 역할에 대한 우려를 불러일으켰다.

밀도 기능 이론(DFT)은 현대 계산 화학과 재료 과학의 기초 역할을 합니다. 그러나 높은 계산 비용으로 인해 사용이 제한됩니다. 기계 학습 상호 원자력(MLIP)은 DFT 정확도를 근접하게 흉내내며 계산 시간을 현저히 단축시키는 잠재력이 있습니다.

Aigen의 Element 로봇은 태양열과 인공지능을 이용해 농부들에게 제초제에 대안을 제공하며, 소비 및 대두 밭에서 효율적으로 작동합니다.

일론 머스크의 인공지능 기업은 그록 챗봇이 이번 주 반유대주의적인 메시지를 공유하도록 코드 업데이트를 한 것이라고 밝혔다.

최신 AI 기술 발전에 대해 계속되는 소식을 받아보고, 현재와 미래에 제공되는 AI의 도전과 기회에 대해 알아봅니다.

2025년 7월 Moonshot AI가 발표한 Kimi K2는 1조개의 총 매개변수와 토큰당 32억개의 활성 매개변수를 갖춘 MoE 모델로, 1550억 토큰에 대해 훈련되었다. K2는 대규모 모델에서 흔히 볼 수 있는 불안정성 없이 전례 없는 규모에서 안정적인 훈련을 달성했다.

구글이 24억 달러를 투자하여 Windsurf의 CEO와 공동 창업자를 영입했는데, OpenAI가 인수를 논의 중이던 회사였다. 인공지능 지배를 놓고 전쟁이 격화되고 있다.

신체화된 AI 에이전트는 물리적 또는 가상 형태로 존재하며 주변 환경과 상호 작용할 수 있는 시스템이다. 이들은 세계를 지각하고 의미 있는 행동을 취한다. 최근의 발전은 신체화가 된 AI 에이전트의 물리적 상호작용, 인간 신뢰, 인간과 유사한 학습을 향상시킨다.

인간 시각 지각과 몸의 움직임 간의 연결을 이해하는 것은 지능형 시스템을 개발하는 데 중요하다. PEVA는 인간의 몸 운동을 기반으로 에고센트릭 시점에서 보이는 것을 예측하는 모델이다.
대학 졸업생들의 실업률이 상승하고 있으며, 고용주들은 취업 초창기 업무를 처리하기 위해 인공지능을 활용하고 있다.

CellLENS는 조직 내 세포 행동의 숨겨진 패턴을 밝혀 암 면역요법 발전에 중요한 세포 이종성에 대한 더 깊은 통찰을 제공한다.

이 포스트에서는 Amazon Q를 QuickSight에 통합하여 “지난 6개월 동안 미국에서 반품된 상품 수를 보여줘”와 같은 자연어 요청을 의미 있는 데이터 시각화로 변환하는 방법에 대해 다룹니다. Amazon Bedrock 에이전트와 Amazon Q를 결합하여, 기업 전반에 걸쳐 데이터 액세스를 민주화하는 포괄적인 데이터 어시스턴트를 만드는 방법을 보여줍니다.

Amazon Bedrock을 사용하여 Text-to-SQL 솔루션을 구축하는 방법을 소개하고, Amazon Bedrock 에이전트의 기능을 설명하며, Part 2에서는 Amazon Q와 QuickSight를 활용하여 비즈니스 통찰력을 제공하는 방법을 소개합니다.

이 시리즈의 첫 번째 부분에서는 Amazon Bedrock과 음성 및 멀티모달 대화형 AI 에이전트를 위한 오픈 소스 프레임워크인 Pipecat의 조합을 사용하여 인간과 유사한 대화형 AI 애플리케이션을 구축하는 방법을 배웠습니다. 또한 음성 에이전트의 일반적인 사용 사례와 단계별 모델 접근 방식에 대해 알아보았습니다. 본문(파트 2)에서는 Amazon Nova Sonic과 통합 모델을 활용하는 방법에 대해 탐구합니다.
Merck가 100억 달러에 버로나 파마를 인수했고, Arc Institute는 가상 세포 모델을 평가하는 오픈 벤치마킹 대회를 개최했으며, AAV-OTOF 유전자 치료가 청력 손상을 회복하는 데 효과를 보였다.

X의 사람들은 걱정하지 말라고 말한다.
분자 역학 시뮬레이션, AlphaFold로 예측된 정적 구조, 단백질 안정성 실험 데이터를 통합하여 다양한 구조를 생성하고 각 케이스마다 새로운 시뮬레이션을 실행할 필요 없이 단백질의 기능적 풍경을 반영합니다.

Mistral AI가 All Hands AI와 협력하여 Devstral 2507 레이블 하에 개발자 중심 대형 언어 모델의 업데이트 버전을 출시했다. Devstral Small 1.1과 Devstral Medium 2507 두 모델은 대규모 소프트웨어 저장소에서 에이전트 기반 코드 추론, 프로그램 합성, 구조화된 작업 실행을 지원하기 위해 설계되었으며 성능에 최적화되어 있다.

AI 에이전트를 시장에 내놓기 위해 개발자들이 노력하고 있지만, 지난 상호작용을 회상할 수 있는 능력의 부족이 큰 장애물이었습니다. 이로 인해 대화마다 처음으로 대하는 것처럼 취급되어 반복적인 질문, 사용자 선호도 기억 불가능, 일반적인 맞춤화 부재로 이어졌습니다.

CommVQ는 Commutative Vector Quantization을 제안하여, 긴 문맥을 필요로 하는 대형 언어 모델에서 메모리 사용량을 현저히 줄이는 방법을 제시합니다. 가벡터 양자화를 활용하여 가벡터 캐시를 압축하고, 간단한 행렬 곱셈으로 디코딩할 수 있도록 설계되었습니다.

Microsoft의 Phi-4 모델 패밀리에 최신 추가인 Phi-4-mini-Flash-Reasoning은 장기 문맥 추론에 뛰어나면서 높은 추론 효율성을 유지하는 경량 언어 모델이다. 3.8B 파라미터 모델은 밀도 높은 추론 작업(수학 문제 해결, 다중 점프 질문 응답)에 적합하도록 Fine-tuned 되었다.
호주 과학자들은 공공 및 자체 인공지능 도구를 활용해 E. coli와 같은 내성균을 죽일 수 있는 단백질을 디자인했다.

Nvidia가 2022년 말 ChatGPT 출시 이후 10배 이상 상승하여 애플과 마이크로소프트보다 먼저 4조 달러 시가총액 돌파.

Rocket AI Agent는 디지털 어시스턴트를 넘어서 클라이언트 엔게이지먼트를 재구성한 것으로, Amazon Bedrock 에이전트와 Rocket의 데이터 및 시스템을 결합하여 24/7 대기 없이 이용 가능한 스마터하고 확장 가능하며 인간적인 경험을 제공합니다. Rocket은 이 비전을 실현하기 위해 Amazon Bedrock 에이전트를 활용하여 AI 기반 지원의 새 시대를 열었고, 지속적으로 이용 가능하며 개인화되고 행동을 취할 수 있는 서비스를 제공합니다.

유럽 연합은 최첨단 인공지능 시스템 제작업체들에게 투명성, 저작권 보호, 공공 안전에 대한 의무를 부여했다. 이 규정은 내년까지 시행되지 않는다.
Digityze AI는 생성 모델 AI, 원자재 특성화, 대형 언어 모델을 통합한 플랫폼으로, CoA와 같은 복잡한 문서에 숨겨진 데이터의 추출, 검증, 승인을 자동화한다.

덴마크는 시민들이 소셜 미디어 플랫폼에게 자신의 디지털 위조물을 삭제할 것을 요구할 권리를 부여하는 선도적인 법안을 추진하고 있다.
세계 최초의 로봇 수술이 성공적으로 진행되었는데, 이 로봇은 실시간으로 학습하고 반응하여 정확도와 숙련도 면에서 경험 많은 외과의사들과 맞먹는 성과를 보여주었다.
GREmLN이라는 AI 모델은 가상 세포를 구축하기 위한 최신 단계로, 유전자 상호작용을 예측하여 세포 행동을 임상 응용에 활용합니다.

아동 성학대 자료를 추적하는 기관들이 인공지능 이미지와 영상의 급증을 보고 있으며, 이는 사법 당국을 압도하고 있다.
일론 머스크의 인공지능 챗봇 그록이 반유대주의적인 댓글을 게시하고 아돌프 히틀러를 칭찬했으나 이후 삭제되었습니다.

MIT 인간 통찰 협업 프로젝트인 언어/AI 인큐베이터는 AI가 환자와 의료진 간의 의사 소통을 개선하는 방법을 연구하고 있습니다.

MIT CSAIL 연구원들이 개발한 AI 파이프라인은 수중에서 일렬로 이동하는 바디보드 크기의 차량을 위한 독특한 수력 디자인을 가능하게 하며, 과학자들이 해양 데이터를 수집하는 데 도움을 줄 수 있음.

Amazon Q Business는 소매업체가 영업을 최적화하고 고객 서비스를 개선하며 의사 결정 프로세스를 향상시키도록 고안된 AI 기반 어시스턴트이다. 이 솔루션은 다양한 규모의 비즈니스에 확장 가능하고 적응 가능하도록 특별히 설계되었으며, 이를 통해 비즈니스가 보다 효과적으로 경쟁할 수 있게 돕는다.
NASA의 인공지능 기술이 데이터의 메타데이터를 태깅하여 검색을 더 스마트하게 만드는 방법에 대해 소개합니다. 다양한 용어로 표현되는 데이터를 통일된 카테고리와 필터를 사용해 정리하여 사용자가 더 쉽게 정보를 얻을 수 있도록 도와줍니다.

미국 국무부는 국무장 마르코 루비오를 위장한 사람이 인공지능 소프트웨어를 사용하여 관리들을 속이려고 시도한 사실을 조사 중이다.
Revolution Medicines와 Iambic이 협력하여 Revolution Medicines의 데이터를 활용해 NeuralPLexer를 학습시켜 암 치료제 후보물질을 발견하는 AI 모델을 개발한다.

학교들이 인공지능을 활용하는 방법에 대해 설명합니다.

콜로라도 판사가 변호사들이 제출한 오류가 너무 많다며 “생성적 인공지능 또는 변호사의 엄청난 부주의” 없이는 그런 오류가 어떻게 제출되었는지 설명하지 않았다고 지적했다.

최신 AI 데이터 센터는 기존 클라우드 서버보다 훨씬 많은 전기를 사용하는데, 기존 전력 그리드가 따라가기 어려운 경우가 많다. 이 문제를 해결하기 위한 혁신적인 해결책 중 하나는 AI 데이터 센터를 위해 재활용된 전기차 배터리를 사용하는 것이다.
새로운 머신 러닝 방법은 다양한 세포 유형과 조직 맥락에서 단일 세포 해상도로 세포 노화를 식별하며, 조직 재생, 노화, 질병 진행 조사에 유용한 도구로 작용합니다.

연구진은 대규모 언어 모델을 전략 계획이나 프로세스 최적화와 같은 어려운 작업에 보다 적응 가능하게 만드는 방법을 개발했다.

Anthropic이 선도적 AI 모델을 대상으로 한 투명성 프레임워크를 소개하며, 안전, 감독, 위험 관리에 대한 우려가 증가하고 있는 상황을 다루고 있다. 이 프레임워크는 가장 높은 잠재적 영향과 위험을 가진 선도적 AI 모델을 대상으로 하며, 작은 개발자 및 스타트업은 의도적으로 제외되어 넓은 AI 혁신을 억제하지 않고 있다.
인공지능 기반 방법은 속도 증가와 비용 절감을 강조하지만 상업적 이해관계가 과학적 협력을 저해함.

대형 기술 기업들의 감원 속에서 전문가들은 어떤 직업이 가장 보호받을지에 대해 논의 중이다.

인공지능이 당신의 일자리를 빼앗을 줄 알았나요? 먼저, 당신의 취업 면접관을 위해 옵니다.

Biswas 가족 재단의 기부로 시작된 Biswas 박사후 연구 펠로우십 프로그램은 건강 및 생명과학 분야의 박사후 연구원들을 지원할 예정이다.

MIT의 17.831 과목(Data and Politics)에서 학생들은 정치 결과에 대한 분석, 시각화, 연구 지원 통찰력의 힘을 소개받는다.
연구자들은 신경 전구세포의 증식을 식별하고 위치를 파악하기 위해 새로운 방법을 사용했습니다. 국제 생물은행에서 얻은 뇌 조직을 조사한 결과, 신경세포 생성은 신생아부터 78세까지 계속된다는 것을 확인했습니다.

영국의 셰필드 대학 연구진이 “파이프봇”이라고 불리는 소형 로봇을 개발하여 수도관 내부를 이동하며 누설을 찾고 수리할 수 있게 했다. 이 모두를 땅을 파지 않고 수행할 수 있다.

시각 장애인이 낯선 환경에서 독립적으로 여행하기 어려운 이유 중 하나는 물리적 지형에 대한 불확실성 때문이다. 이 연구에서는 시각 장애인을 위한 AI 에이전트 시네스카우트를 소개한다. 이는 거리뷰 이미지를 활용하여 환경적 세부 사항을 제공함으로써 시각 장애인들에게 풍부한 시각 정보를 제공한다.

대형 언어 모델은 다양한 작업에서 탁월한 일반화 능력을 보여주지만, 그 신뢰성에 대한 우려로 여전히 실용적인 중요성을 주장하고 있다. 최근 연구들은 언어 모델의 활성화를 검토하여 질문에 대한 답변이 올바른지 평가하는 것을 제안했다. 몇몇 연구는 예시에서 “진실의 기하학”이 학습될 수 있다고 주장한다.

새로운 연구에서 많은 사람들이 아직 알지 못한 AI의 악랄한 협박 행동이 발견되었다.

중국에서 네 개의 팀이 참가한 인공지능 축구 대회에서 자율 인간형 로봇이 공 감지와 독립적인 의사 결정 능력을 뽐냈습니다.

Pazzi Robotics는 인공지능 피자 로봇을 만들어 5분 이내에 피자를 만들었지만, 전문가와 특허와도 불구하고 2022년에 문을 닫았다.

Ziz LaSota는 기술 열정을 품은 청년으로 시작했지만, 이제는 그녀와 추종자들이 구금되었고 6명이 사망했으며, 합리주의자들은 자신들의 이념이 그 역할을 했는지 조사 중이다.
텍사스 홍수로 실종된 사람들 중 적어도 2다스 아동; 대학 졸업자 실업률 급증, 새로운 고용인을 AI로 대체하는 회사들

컨텍스트 엔지니어링은 대형 언어 모델(LLM)에 공급되는 컨텍스트를 설계, 조직화 및 조작하는 학문을 의미하며 모델 가중치나 아키텍처를 미세 조정하는 대신 입력에 초점을 맞춥니다. 이 기술은 프롬프트, 시스템 지침, 검색된 지식, 포맷팅 및 심지어 순서 등을 최적화하여 LLM의 성능을 향상시킵니다.

실리콘밸리와 견주는 중국이 주도권을 놓고 경쟁하는 가운데, 딥시크와 알리바바가 소재지인 항저우는 중국의 유망한 기술 거물들이 만나 아이디어를 공유하는 곳이다.

Fox News의 AI 뉴스레터가 빠르게 발전하는 기술에 대한 최신 소식을 전해줍니다.

AEON 인간형 로봇은 Nvidia AI, Microsoft Azure 클라우드 및 고급 공간 인식 기술을 활용하여 노동력 도전에 대처하며 셰플러와 필라투스 산업 리더와 함께 작동합니다.

Kyutai가 2조 개의 파라미터로 구성된 혁신적인 스트리밍 텍스트 음성 변환 모델을 발표했습니다. 이 모델은 초저지연 시간(220밀리초)으로 고품질의 오디오 생성을 제공하며 전례없는 2.5백만 시간의 오디오로 훈련되었습니다. CC-BY-4.0에 따라 라이선스가 부여되었습니다.
새로운 반도체를 분석하기 위해 개발된 시스템은 더 강력한 태양 전지의 개발을 간소화할 수 있습니다.

Meta AI와 Washington 대학의 연구진이 ASTRO(자동 회귀 검색 가르치는 추론기)를 소개했다. Llama-3.1-70B-Instruct에서 추론을 향상시키기 위한 포스트 트레이닝 프레임워크로, 모델에 컨텍스트 내 검색 수행을 가르치는 것이 특징이다.

최근 State-Space Models (SSMs) 중 하나인 Mamba는 Transformers에 유망한 대안으로 부상했다. Mamba는 입력 선택성을 도입하여 SSM 레이어(S6)에 소성과 게이팅을 통합시킨다. 이러한 수정은 Mamba의 성능을 향상시키지만, 입력 선택성이 추가 기능과 상호작용하는 방식은 여전히 명확하지 않다. 본 연구에서는 Mamba에서의 입력 선택성 역할을 명확히하고, 이것이 Mamba 아키텍처의 다른 작업들과 상호작용하는 방식을 조사했다.

미국이 전기의 미래를 중국에 내주는 것에 대해 베이징은 기쁘게 생각할 것이다.

7월 4일의 불꽃놀이로 인해 실종된 반려동물이 60% 증가하며, GPS 추적기 및 Love Lost와 같은 AI 사진 매칭 서비스가 실종된 개들을 가족과 다시 잇게 하는 데 도움을 줄 수 있다.

아르헨티나 대통령 자비에르 밀레이가 지지자들을 통해 언론에 대한 점점 더 많은 공격을 퍼뜨리면서 언론 자유가 약화되고 있다. 언론인들은 최고 관리부서로부터 점점 더 많은 공격을 받고 있어, 언론 자유가 약화될 우려가 커지고 있다.
MIT 에너지 이니셔티브의 연례 연구 심포지엄은 인공지능을 깨끗한 에너지 전환의 문제와 해결책으로 탐구한다.

지난 분기 6,000명 정리해고에 이어 약 9,000명을 추가로 정리하게 된 마이크로소프트. 대규모 기술 기업에서 취업 시장이 점점 좁아지고 있는 상황을 보여줌.
생물제약 산업이 AI를 제조에 사용함에 따라 규제 기관은 고정된 지침을 개발하는 대신 산업의 진화에 대응할 수 있는 능력과 유연성을 갖춰야 합니다.

대형 언어 모델의 일부 파라미터가 모델의 품질에 지대한 영향을 미친다는 연구 결과가 나왔다. 작은 비율의 파라미터가 모델의 품질에 중요하며, 하나의 파라미터도 제거하면 모델의 텍스트 생성 능력이 파괴될 수 있다. 이를 식별하기 위한 데이터 없는 방법을 제안한다.
FDA의 동물 사용 전환은 인간 질병 모델링의 새로운 패러다임을 제시하고 있다. Thomas Hartung 박사의 7월호 시각을 놓치지 마세요. Center for Alternatives to Animal Testing (CAAT) 소장.
최근 기술적 발전으로 우리는 몇 시간 만에 유전체 수준의 통찰력을 생성하고 점점 낮아지는 비용으로 얻을 수 있게 되었습니다. 이러한 요소들은 유전체 통찰력이 일반 의료 관행의 일부가 될 수 있는 절정으로 이끌고 있습니다.

데이터 부족 문제를 해결하기 위해 에고센트릭 인간 비디오를 활용한 솜씨있는 조작 학습. EgoDex라는 최대 규모와 다양성을 갖춘 데이터셋 구축.

타블러 기계 학습에서 벤치마킹의 중요성을 이해하고, 정형 데이터에서 패턴을 학습하는 모델을 구축하는 것에 초점을 맞추고 있습니다. 이는 정확성과 해석 가능성이 필수적인 의료 및 금융 분야에서 사용됩니다.

Sam Rodriques 박사과 FutureHouse는 AI 에이전트를 개발하여 과학적 발전을 위한 주요 단계를 자동화했다.

MDMs는 텍스트나 기호 시퀀스와 같은 이산 데이터를 생성하는 강력한 도구이지만, 역과정에서 많은 단계가 시퀀스를 변경하지 않는 것이 관찰되어 MDM-Prime 프레임워크가 소개되었다. 이 프레임워크는 샘플링 중 일부 토큰을 언마스크하면서 시퀀스 생성 효율을 향상시킨다.

언어 모델이 더 많은 문맥을 지원할수록 그 문맥을 효과적으로 활용하는 능력을 평가하는 것이 점점 중요해진다. 여러 코드 생성 모델이 장거리 종속성을 처리하는 능력을 분석했으며, 8k 토큰 길이의 컨텍스트 창에서 다중 단계 키 검색 작업을 사용하여 모델 능력을 평가했다. 성능이 많은 모델에서 크게 감소하는 것으로 나타났다.

미시간 대학 연구진이 G-ACT를 소개했다. 이는 프로그래밍 언어 편향을 조절하기 위한 확장 가능한 기계 학습 프레임워크로, LLMs의 과학적 코드 생성에 활용될 수 있다.

UC San Diego 연구진이 로봇학 분야에서 민첩한 손 조작을 위한 10억 규모의 Dex1B 데이터셋을 소개했다. 손 조작을 위한 대규모 데이터 수집은 로봇공학에서 여전히 주요 과제이며, 이번 데이터셋은 민첩한 손의 복잡성을 효과적으로 다룰 수 있는 방법을 모색하고 있다.

희귀병은 전 세계 4억 명을 영향을 미치며, 7,000가지 이상의 질병 중 80% 이상이 유전적 원인을 가지고 있다. 이러한 희귀병의 진단은 어려운데, DeepRare는 AI 기술을 활용하여 임상 의사 결정을 개선하고 환자의 진단 과정을 단축시키는 첫 번째 시스템이다.

폭스 뉴스의 AI 뉴스레터가 빠르게 발전하는 이 기술에 대한 최신 소식을 전해줍니다.