staging.mijutoday.com

모델 컨텍스트 프로토콜(MCP)과 AI 에이전트 스킬 비교: LLM을 위한 구조화 도구와 행동 지침 분석

최근 AI 에이전트 생태계에서는 외부 도구와 도메인 지식 활용을 위한 두 가지 접근법인 스킬과 모델 컨텍스트 프로토콜(MCP)이 주목받고 있다. 이들은 설정과 작업 수행 방식에서 차이를 보인다.

2026년 3월 13일 오전 4시 32분

구글 AI, ‘Groundsource’ 공개…Gemini 모델로 비정형 뉴스 데이터를 역사적 정보로 변환

구글 AI 연구팀이 Gemini 모델을 활용해 비정형 글로벌 뉴스에서 구조화된 역사 데이터를 추출하는 새로운 방법론 ‘Groundsource’를 발표했다. 이 프로젝트는 급작스러운 자연재해에 대한 역사 데이터 부족 문제를 해결하는 데 목적이 있다.

2026년 3월 13일 오전 4시 07분

구글 콜랩에서 Andrej Karpathy의 AutoResearch 프레임워크로 자율 머신러닝 연구 루프 구축하기

이 튜토리얼에서는 Andrej Karpathy가 제안한 AutoResearch 프레임워크를 구글 콜랩에 맞게 구현하는 방법을 소개합니다. 자동화된 실험 파이프라인을 구축해 하이퍼파라미터 조정과 실험 추적을 자동으로 수행합니다.

2026년 3월 12일 오후 6시 46분

스탠퍼드 연구진, 도구와 학습 기능 갖춘 개인 AI 에이전트용 오픈소스 프레임워크 'OpenJarvis' 공개

스탠퍼드 대학 연구진이 기기 내에서 완전히 작동하는 개인 AI 에이전트를 개발할 수 있는 오픈소스 프레임워크 'OpenJarvis'를 발표했다. 이 플랫폼은 로컬 우선 AI 시스템 구축을 위한 연구 및 배포용 인프라를 제공한다.

2026년 3월 12일 오후 5시 21분

동적 환경에서 부분 추론, 온라인 재계획, 반응형 중간 실행 적응을 갖춘 스트리밍 의사 결정 에이전트 설계 방법

이 튜토리얼에서는 계속해서 안전한 부분 추론 업데이트를 스트리밍하는 동안 온라인으로 생각하고 행동하는 스트리밍 의사 결정 에이전트를 구축합니다. 이는 이동하는 장애물과 이동하는 목표가 있는 동적 그리드 월드를 구현하고, 온라인 A* 플래너를 사용하여 미래 몇 단계에만 집중합니다.

2026년 3월 11일 오후 7시 44분

NVIDIA, Nemotron 3 Super 공개: 120B 파라미터 오픈소스 하이브리드 Mamba-Attention MoE 모델, 에이전틱 AI에 5배 높은 처리량 제공

NVIDIA가 Nemotron 3 Super를 공개했다. 이 모델은 복잡한 다중 에이전트 응용 프로그램을 위해 설계된 놀라운 1200억 파라미터 추론 모델로, 경쟁 모델보다 5배 높은 처리량을 제공한다.

2026년 3월 11일 오후 2시 19분

구글 AI, Gemini Embedding 2 소개: 텍스트, 이미지, 비디오, 오디오, 문서를 포함한 다중 모달 임베딩 모델

구글이 Gemini Embedding 2를 발표했다. 이 모델은 텍스트 뿐만 아니라 이미지, 비디오, 오디오, 문서 등을 임베딩 공간으로 가져와 AI 개발자가 고차원 저장 및 교차 모달 검색 도전에 대처할 수 있도록 설계되었다.

2026년 3월 11일 오전 3시 18분

Fish Audio가 Fish Audio S2를 출시하며 감정을 엄청나게 제어할 수 있는 혁신적인 텍스트 음성 변환(TTS)의 새로운 세대를 선보임

Fish Audio의 S2-Pro은 Fish Speech 생태계 내에서의 플래그십 모델로, 고품질의 다중 화자 합성과 150ms 미만의 대기 시간을 갖춘 오픈 아키텍처로의 전환을 대표함. 릴리스는 제로샷 보이스 클로닝과 세밀한 음성 복제를 위한 프레임워크를 제공함.

2026년 3월 11일 오전 12시 58분

자동으로 작업별 AI 에이전트를 구축, 생성 및 정제하는 자가 설계 메타 에이전트를 구축하는 방법

이 튜토리얼에서는 간단한 작업 설명서로부터 자동으로 다른 에이전트를 설계하는 메타 에이전트를 구축합니다. 작업을 분석하고 도구를 선택하며 메모리 아키텍처를 선택하고 계획자를 구성한 다음 완전히 작동하는 에이전트 런타임을 인스턴스화하는 시스템을 구현합니다. 정적 에이전트 템플릿을 넘어서 동적이고 자가 구성되는 아키텍처를 구축합니다.

2026년 3월 11일 오전 12시 23분

NVIDIA AI, Nemotron-Terminal: LLM 터미널 에이전트 확장을 위한 체계적인 데이터 엔지니어링 파이프라인 공개

NVIDIA가 Nemotron-Terminal을 공개했다. 이는 LLM 터미널 에이전트의 확장을 위한 체계적인 데이터 엔지니어링 파이프라인으로, 자율 주행 AI 에이전트 구축 경쟁에서 데이터가 병목 현상을 일으키고 있다. 새로운 모델과 훈련 전략의 불투명성은 연구자와 개발자를 고비용의 암묵적인 사이클로 몰아넣고 있다.

2026년 3월 10일 오후 4시 15분

내부 비평가, 자기 일관성 추론 및 불확실성 추정을 결합한 신뢰할 수 있는 의사 결정을 위한 위험 인식 AI 에이전트 구축 방법

이 튜토리얼에서는 내부 비평가와 불확실성 추정 프레임워크를 통합하여 단순한 응답 생성을 넘어진 심화된 에이전트 시스템을 구축한다. 다중 샘플 추론을 시뮬레이션하고 후보 응답을 정확도, 일관성, 안전성 측면에서 평가하며, 엔트로피, 분산, 일관성 측정을 사용하여 예측 불확실성을 양적화한다. 자신감을 균형있게 유지하기 위해 위험에 민감한 선택 전략을 구현한다.

2026년 3월 10일 오전 2시 35분

바이트댄스, 복잡한 작업을 수행하는 오픈소스 슈퍼에이전트 하네스 'DeerFlow 2.0' 출시

바이트댄스가 DeerFlow 2.0을 공개했다. 이 프레임워크는 '슈퍼에이전트'로 일을 제안하는 것뿐만 아니라 실행하는 기능을 갖추고 있어, 복잡한 작업을 수행할 수 있다.

2026년 3월 10일 오전 2시 10분

Andrew Ng의 팀이 발표한 Context Hub: 코딩 에이전트에게 필요한 최신 API 문서를 제공하는 오픈 소스 도구

Andrew Ng와 그의 팀이 개발한 Context Hub은 코딩 에이전트의 정적 훈련 데이터와 현대 API의 빠르게 변화하는 현실 사이의 간극을 줄이기 위해 설계된 오픈 소스 도구입니다.

2026년 3월 9일 오후 4시 47분

Anthropic, 고급 에이전틱 다단계 추론 루프를 사용하여 복잡한 보안 연구 자동화를 위한 Claude Code를 통한 코드 리뷰 도입

Anthropic은 Claude Code를 통해 고급 에이전틱 다단계 추론 루프를 활용해 복잡한 보안 연구를 자동화하는 코드 리뷰를 소개하고 있다. 이는 AI가 보일러플레이트만 작성하는 것을 넘어서 실제로 왜 Kubernetes 클러스터가 새벽 3시에 알람을 울리는지 이해하는 AI 에이전트를 지향하는 것이다.

2026년 3월 9일 오후 4시 28분

'베이지안' 업그레이드: 왜 구글 AI의 새 가르침 방법이 LLM 추론의 열쇠인가

구글 연구팀은 현재의 AI 에이전트들이 '확률적 추론' 능력을 크게 부족하다고 주장하며, 대규모 언어 모델(LLM)이 새로운 증거를 기반으로 믿음을 업데이트하는 냉정하고 단단한 논리에 대해 얼마나 고집스러운지 설명했다.

2026년 3월 9일 오전 4시 23분

Scanpy를 사용하여 클러스터링 시각화 및 세포 유형 주석에 대한 완전한 단일 세포 RNA 시퀀싱 분석 파이프라인 구축 코딩 가이드

이 튜토리얼에서는 Scanpy를 사용하여 단일 세포 RNA 시퀀싱 분석을 위한 완전한 파이프라인을 구축합니다. 필요한 라이브러리를 설치하고 PBMC 3k 데이터세트를 로드한 다음 품질 관리, 필터링, 정규화를 수행하여 데이터를 준비합니다. 고변동 유전자를 식별하고 차원 축소를 위해 PCA를 수행한 후 클러스터링 및 시각화를 진행합니다.

2026년 3월 9일 오전 1시 03분

OpenAI, 콘텍스트 인식 취약점 탐지 및 패치 생성을 위한 Codex Security 연구 미리보기 소개

OpenAI가 Codex Security를 소개했습니다. 이는 코드베이스를 분석하여 취약점을 확인하고 개발자가 수정 전에 검토할 수 있는 보안 에이전트입니다. 제품은 ChatGPT Enterprise, Business 및 Edu 고객을 대상으로 연구 미리보기로 롤아웃 중입니다.

2026년 3월 6일 오후 3시 49분

구글 AI, 안드로이드 개발을 위한 LLMs 평가 프레임워크 및 리더보드 '안드로이드 벤치' 공개

구글이 안드로이드 개발 작업에서 Large Language Models (LLMs)의 성능을 측정하기 위한 새로운 리더보드 및 평가 프레임워크인 안드로이드 벤치를 공개했다. 데이터셋, 방법론, 테스트 하네스는 GitHub에서 공개되었으며, 일반 코딩 벤치마크가 캡처하지 못하는 안드로이드 개발 작업에 적합하다.

2026년 3월 6일 오후 2시 53분

Liquid AI, LFM2-24B-A2B를 활용한 LocalCowork 출시, Model Context Protocol (MCP)를 통해 로컬에서 개인정보 보호형 에이전트 워크플로우 실행

Liquid AI가 LocalCowork를 발표했는데, 이는 LFM2-24B-A2B를 활용한 모델로, 기업 워크플로우를 기기 내에서 완전히 실행할 수 있도록 해준다. API 호출과 데이터 이탈을 없애 프라이버시에 민감한 환경에서 사용된다.

2026년 3월 6일 오전 12시 45분

Daft를 활용한 고성능 구조화 및 이미지 데이터 처리를 위한 확장 가능한 엔드투엔드 머신러닝 데이터 파이프라인 구축 코딩 가이드

이 튜토리얼에서는 Daft를 사용하여 고성능의 파이썬 데이터 엔진으로 엔드투엔드 분석 파이프라인을 구축하는 방법을 탐구합니다. MNIST 데이터셋을 로드한 다음 UDF, 피처 엔지니어링, 집계, 조인 및 지연 실행을 통해 점진적으로 변환하는 방법을 살펴봅니다. 구조화된 데이터 처리, 숫자 계산, 이미지 처리 등을 원활하게 결합하는 방법을 보여줍니다.

2026년 3월 5일 오후 6시 07분

최신뉴스 전체보기

기업 워크플로에 대한 모니터링, 오케스트레이션 및 확장성을 갖춘 프로덕션 레디 사용자 정의 AI 에이전트 구축

PyTorch 및 주요 Python 도구를 활용한 사용자 정의 에이전트 프레임워크의 설계 및 구현 방법을 안내하는 튜토리얼. 모니터링된 CustomTool 클래스에 핵심 기능을 포장하고 시스템 프롬프트를 통해 여러 에이전트를 오케스트레이션하며 확장성 있는 코드 생성기를 활용하는 방법을 학습합니다.

2025년 6월 22일 오후 7시 08분

EmbodiedGen: 현실적인 탈바꿈 AI 시뮬레이션을 위한 확장 가능한 3D 월드 생성기

Embodied AI의 3D 환경을 확장하는 과제. 현실적이고 정확한 3D 환경은 Embodied AI의 교육과 평가에 중요하다. 현재의 방법은 비용이 많이 들고 현실감이 부족해 확장성과 일반화를 제한한다. EmbodiedGen은 이러한 문제를 해결하기 위해 개발되었다.

2025년 6월 22일 오후 4시 18분

구글 연구자들이 Magenta RealTime을 공개: 실시간 AI 음악 생성용 개방형 가중치 모델

구글의 Magenta 팀이 Magenta RealTime(Magenta RT)을 소개했다. Magenta RT는 실시간 음악 생성 모델로, 사용자가 스타일을 제어할 수 있는 동적한 실시간 추론을 지원하는 최초의 대규모 음악 생성 모델이다. Apache 2.0 라이선스로 GitHub와 Hugging Face에서 제공된다.

2025년 6월 22일 오전 3시 53분

DeepSeek 연구원들이 ‘nano-vLLM’이라는 개인 프로젝트를 오픈소스로 공개: 처음부터 구축된 가벼운 vLLM 구현

DeepSeek 연구자들이 ‘nano-vLLM’을 공개했다. 이는 가벼우면서도 효율적인 vLLM(가상 대형 언어 모델) 엔진의 최소주의적이고 효율적인 구현으로, 간결하고 읽기 쉬운 코드베이스에 고성능 추론 파이프라인의 본질을 응축시켰다.

2025년 6월 22일 오전 3시 26분

IBM의 MCP 게이트웨이: 다음 세대 AI 툴체인을 위한 통합 FastAPI 기반 모델 컨텍스트 프로토콜 게이트웨이

IBM의 MCP Gateway는 FastAPI 기반의 게이트웨이를 제공하여 모델 컨텍스트 프로토콜 (MCP)에 대한 통합 인터페이스를 제공하며, 현대 AI 툴체인을 확장하고 관리하는 데 도움을 줍니다.

2025년 6월 22일 오전 2시 30분

Apple의 AI 추론 비판은 너무 이르다

최근 대형 추론 모델(LRMs)의 추론 능력에 대한 논쟁은 Apple의 “사고의 환영”과 Anthropic의 “사고의 환영의 환영”이라는 두 논문으로 활발해졌다. Apple의 논문은 LRMs의 추론 능력에 근본적 한계를 주장하는 반면, Anthropic은 이러한 주장이 평가의 결함에서 비롯된 것이라고 주장한다.

2025년 6월 22일 오전 2시 11분

텍사스 에이엠 대학 연구진, 고속 유동 시뮬레이션을 위한 ‘ShockCast’라는 두 단계 머신러닝 방법 소개

텍사스 에이엠 대학 연구진이 고속 유동 시뮬레이션을 위한 ‘ShockCast’라는 머신러닝 방법을 소개했다. ‘ShockCast’는 신경망 시간 재메싱과 함께 고속 유동을 시뮬레이션하기 위해 고안되었으며, 충격파와 팽창팬과 관련된 빠른 변화로 인해 고속 유체 유동 모델링에 독특한 도전점이 있다.

2025년 6월 22일 오전 1시 43분

WINGS 소개: 멀티모달 대형 언어 모델에서 텍스트만 기반 잊힘 방지를 위한 듀얼-러너 아키텍처

멀티모달 대형 언어 모델은 이미지와 텍스트를 처리하여 상호작용적이고 직관적인 AI 시스템을 발전시키는데 기여한다. 이 논문에서는 WINGS 아키텍처를 소개하며, 텍스트만 기반으로 학습된 모델이 정보를 잊는 것을 방지하는 방법을 제시한다.

2025년 6월 21일 오후 5시 57분

Mistral AI, Mistral Small 3.2 출시: AI 통합을 위한 강화된 명령 따르기, 반복 감소 및 강화된 함수 호출

Mistral AI가 Mistral Small 3.2를 출시했다. 이 버전은 반복적인 오류 최소화, 강화된 강인성, 사용자 상호작용 향상을 위해 설계되었으며 AI 모델이 더욱 복잡한 계산 작업에 필수적해지는 가운데, 실제 시나리오에 매끄럽게 통합될 수 있도록 지속적으로 업그레이드되고 있다.

2025년 6월 21일 오후 5시 31분

UAgents 및 Google Gemini를 활용한 이벤트 주도형 AI 에이전트 구축: 모듈식 Python 구현 가이드

이 튜토리얼에서는 UAgents 프레임워크를 사용하여 Google Gemini API 위에 가벼운 이벤트 주도형 AI 에이전트 아키텍처를 구축하는 방법을 보여줍니다. nest_asyncio를 적용하여 중첩된 이벤트 루프를 활성화하고 Gemini API 키를 구성한 다음 GenAI 클라이언트를 인스턴스화하는 방법을 설명합니다.

2025년 6월 21일 오후 3시 13분

Flow 매칭 모델에서의 일반화는 근사로부터 나온다, 확률성이 아닌

Deep generative models의 일반화 능력과 기작을 이해하는 것이 어려운데, generative models이 실제로 일반화를 하는지 여부에 대한 이해가 중요하다. Flow matching 모델에서의 일반화는 근사에서 나오며 확률성과는 무관하다.

2025년 6월 21일 오후 2시 19분

A2A 호환 랜덤 넘버 에이전트 구축: Python으로 저수준 Executor 패턴 구현하는 단계별 가이드

구글의 새 표준 인 A2A 프로토콜은 AI 에이전트들이 표준화된 메시지, 에이전트 카드 및 작업 기반 실행을 통해 HTTP를 통해 상호 작용할 수 있도록 하는 것을 가능하게 합니다. 이를 통해 AI 에이전트들이 개발자나 기반이 되는 프레임워크에 관계없이 원활하게 통신하고 협업할 수 있습니다.

2025년 6월 21일 오전 3시 19분

메타 AI 연구자들, 언어 모델링 벤치마크에서 토큰 기반 트랜스포머를 능가하는 확장 가능한 바이트 수준 자기회귀 U-Net 모델 소개

언어 모델링은 자연어 처리에서 중요한 역할을 하며, 기계가 인간 언어와 유사한 텍스트를 예측하고 생성할 수 있게 합니다. 최근 대규모 트랜스포머 시스템으로 발전한 모델들 중 하나인 확장 가능한 바이트 수준 자기회귀 U-Net 모델이 토큰 기반 트랜스포머를 능가하는 것으로 나타났다.

2025년 6월 21일 오전 2시 43분

PoE-World + Planner가 최소한의 데모 데이터로 몬테즈마의 복수에서 강화 학습 RL 기준을 능가

심볼릭 추론의 중요성을 강조하며, AI 에이전트가 복잡한 상황에 적응할 수 있도록 하는 것이 중요하다. Dreamer와 같은 신경망 기반 모델은 유연성을 제공하지만 효과적으로 학습하기 위해 엄청난 양의 데이터가 필요하다. 반면 최근 방법들은 더 적은 양의 데이터로도 효율적인 학습이 가능하다.

2025년 6월 20일 오후 2시 01분

Streamlit를 사용하여 실시간 상호작용을 위한 지능형 멀티툴 AI 에이전트 인터페이스 구축하기

이 튜토리얼에서는 LangChain, Google Gemini API 및 고급 도구 모음의 기능을 결합하여 스마트 AI 어시스턴트를 만드는 강력하고 인터랙티브한 Streamlit 애플리케이션을 구축할 것이다. Streamlit의 직관적 인터페이스를 사용하여 웹 검색, 위키피디아 콘텐츠 가져오기, 계산 수행, 키 기억 등을 수행할 수있는 채팅 기반 시스템을 만들 것이다.

2025년 6월 20일 오전 3시 40분

UC Berkeley가 CyberGym을 소개: 대규모 코드베이스 전체의 AI 에이전트를 평가하는 실세계 사이버보안 평가 프레임워크

UC 버클리가 AI 도구의 확장된 기능과 대규모 소프트웨어 시스템에 대한 의존도 증가로 AI 분야에서 사이버보안이 중요해지면서 CyberGym을 소개했다. 새로운 프레임워크는 대규모 코드베이스에서 AI 에이전트를 평가하여 보안 측면에서 새로운 차원을 제공한다.

2025년 6월 20일 오전 1시 57분

구글 AI 논문, 기계 학습 평가에서 부분집단 공정성 해석하기 위한 인과적 프레임워크 소개

구글의 AI 논문에서는 인종, 성별, 사회경제적 배경과 같은 속성으로 정의된 다양한 부분집단에서 모델의 성능을 평가하는 것이 기계 학습에서의 공정성을 평가하는 중요한 요소임을 소개하고 있습니다. 이 평가는 의료 분야와 같이 부조그룹 간의 모델 성능 차이가 치료 권고나 진단에 불평등을 초래할 수 있는 맥락에서 중요합니다.

2025년 6월 20일 오전 1시 09분

백엔드 자동화부터 프론트엔드 협업까지: AI 에이전트-사용자 상호작용을 위한 AG-UI 최신 업데이트 소식

AI 에이전트는 순수한 백엔드 자동화에서 현대 애플리케이션 내에서 시각적이고 협력적인 요소로 이동하고 있습니다. 그러나 사용자에게 응답하고 업무를 적극적으로 안내할 수 있는 상호작용이 가능한 에이전트를 만드는 것은 엔지니어링적인 머리아픔이 오래전부터 계속되어왔습니다.

2025년 6월 19일 오후 11시 38분

MiniMax AI가 MiniMax-M1을 공개: 장기 문맥 및 강화 학습을 위한 456B 파라미터 하이브리드 모델

AI 모델의 장기 문맥 추론 도전, AI가 현실 세계와 소프트웨어 개발 환경에서 더 많은 책임을 맡을 때, 연구자들은 장기 문맥과 강화 학습에 적합한 아키텍처를 찾고 있다.

2025년 6월 19일 오후 1시 40분

OpenAI, 에이전트 SDK를 사용한 고객 서비스 에이전트 데모의 오픈소스 버전 공개

OpenAI가 에이전트 SDK를 사용하여 도메인에 특화된 인공지능(AI) 에이전트를 구축하는 방법을 보여주는 새로운 다중 에이전트 고객 서비스 데모를 GitHub에 공개했습니다. 항공사 고객 서비스 챗봇 모델인 이 프로젝트는 다양한 여행 관련 쿼리를 처리할 수 있으며 요청을 전문 에이전트로 동적으로 라우팅합니다. Python 백엔드와 Next.js 프론트엔드로 구축되었습니다.

2025년 6월 19일 오전 3시 35분

ReVisual-R1: 장기적이고 정확하며 심사숙고한 추론을 이루는 오픈 소스 7B 멀티모달 대형 언어 모델 (MLLMs)

최근 텍스트 기반 언어 모델의 발전으로 RL이 강력한 추론 기술 개발에 도움이 되는 것을 입증했다. 이에 영감을 받아 연구자들은 시각적 및 텍스트 입력 간 추론 능력을 향상시키기 위해 동일한 RL 기술을 MLLMs에 적용하려고 시도해왔지만 성공하지 못했다.

2025년 6월 19일 오전 2시 54분

HtFLlib: 이질적 페더레이티드 러닝 방법을 평가하기 위한 통합 벤치마킹 라이브러리

AI 연구 기관들은 고유한 요구 사항에 맞는 이질적 모델을 개발하지만, 훈련 중 데이터 부족 문제에 직면한다. 기존 페더레이티드 러닝은 동질적 모델 협업만 지원하므로, 고객이 고유한 요구 사항에 맞는 모델 아키텍처를 개발할 때 문제가 발생한다.

2025년 6월 18일 오후 9시 54분

고급 BrightData 웹 스크레이퍼 구축하기: AI 기반 데이터 추출을 위한 Google Gemini 활용 방법

BrightData의 강력한 프록시 네트워크와 Google Gemini API를 활용한 향상된 웹 스크래핑 도구 구축 방법 소개. Python 프로젝트 구조화, 필요한 라이브러리 설치 및 가져오기, BrightDataScraper 클래스 내부의 스크래핑 로직 캡슐화 등을 다룸.

2025년 6월 18일 오후 2시 02분

작은 언어 모델(SLMs)이 기계학습 AI의 효율성, 비용, 실용적 배치 재정의할 준비가 되어있다

작은 언어 모델(SLMs)이 인간과 유사한 능력과 대화 기술로 널리 존경받지만, 기계학습 AI 시스템의 성장으로 인해 반복적이고 전문화된 작업에 점점 더 활용되고 있다. 주요 IT 기업의 절반 이상이 이미 AI 에이전트를 사용하고 있으며, 상당한 자금과 예상된 투자를 받고 있다.

2025년 6월 18일 오후 1시 27분

인공 신경망 오토인코더의 내부 작동을 드러내는 잠재 벡터 필드의 중요성

오토인코더와 잠재 공간은 고차원 데이터의 압축 표현을 학습하는 데 사용되는데, 이들은 데이터를 저차원 잠재 공간으로 투영하고 다시 원래 형태로 재구성하는 인코더-디코더 구조를 사용한다. 이 논문에서는 잠재 벡터 필드가 신경 오토인코더의 내부 작동을 어떻게 드러내는지에 대해 설명한다.

2025년 6월 18일 오전 4시 37분

AREAL: 대규모 추론 모델 학습 가속화를 위한 완전 비동기 강화 학습

대규모 추론 모델 학습을 가속화하기 위해 완전 비동기 강화 학습을 사용하는 AREAL 소개. 대규모 추론 모델은 수학 및 코딩과 같은 복잡한 문제에 대한 성능을 향상시키기 위해 최종 답변을 제공하기 전에 중간 “사고” 단계를 생성한다.

2025년 6월 18일 오전 4시 16분

Polars를 사용한 고성능 금융 분석 파이프라인 구축: Lazy Evaluation, 고급 표현식 및 SQL 통합

Polars를 활용한 데이터 분석 파이프라인 구축 튜토리얼. Polars의 lazy evaluation, 복잡한 표현식, 창 함수 및 SQL 인터페이스 활용하여 대규모 금융 데이터셋 효율적으로 처리하는 방법을 소개.

2025년 6월 17일 오후 9시 37분

Fine-Tuning에서 Prompt Engineering으로: 효율적인 트랜스포머 적응을 위한 이론과 실제

Self-attention을 이용한 대규모 트랜스포머 모델의 섬세한 조정 도전, 효율적인 트랜스포머 적응을 위한 이론과 실제에 대한 내용 소개.

2025년 6월 17일 오후 9시 14분

파이썬-A2A를 사용하여 금융 에이전트를 구축하고 Google의 에이전트 간 프로토콜(A2A)에 연결하는 방법

파이썬 A2A는 구글의 에이전트 간(A2A) 프로토콜의 구현으로, AI 에이전트들이 서로 통신할 수 있게 해줍니다. 이 튜토리얼에서는 파이썬-a2a 라이브러리가 제공하는 데코레이터 기반 방법을 사용합니다. 간단한 @agent와 @skill 데코레이터를 사용하여 에이전트의 기능을 정의할 수 있습니다.

2025년 6월 17일 오전 1시 25분

EPFL 연구진, LLMs에서 평생 학습 모델 편집을 위한 확장 가능한 프레임워크 MEMOIR 소개

EPFL 연구진은 폭넓은 데이터셋에서의 사전 학습을 통해 다양한 작업에 뛰어난 성능을 보이는 LLMs가 배포 중에 오래된 정보나 편향을 반영할 수 있어 지속적인 지식 업데이트가 필요한 문제를 제기. 기존의 파인 튜닝 방법은 비용이 많이 들고 재앙적인 망각에 취약한데, EPFL은 이에 대처할 수 있는 MEMOIR 프레임워크를 소개함.

2025년 6월 17일 오전 12시 41분

OpenBMB가 MiniCPM4를 출시: 희소 어텐션과 빠른 추론을 갖춘 엣지 장치용 초 효율적 언어 모델

대형 언어 모델은 AI 시스템에서 중요한 역할을 하고 있지만, 클라우드 인프라를 필요로 하기 때문에 레이턴시, 높은 비용 및 개인 정보 보호 문제가 발생한다. OpenBMB의 MiniCPM4는 희소 어텐션과 빠른 추론을 통해 엣지 장치를 위한 초 효율적인 언어 모델을 제공한다.

2025년 6월 16일 오후 1시 39분

StepFun이 Step-Audio-AQAA를 소개합니다: 자연스러운 음성 상호작용을 위한 완전한 엔드 투 엔드 오디오 언어 모델

Step-Audio-AQAA는 음성 인식, 자연어 이해, 오디오 생성을 결합한 오디오 언어 모델로, 텍스트 변환에 의존하지 않고 음성 상호작용을 위해 설계되었습니다.

2025년 6월 16일 오전 4시 17분

EPFL 연구진, CVPR에서 FG2 발표: GPS 거부 환경에서 자율 주행 차량의 위치 오차 28% 감소하는 새 AI 모델 공개

EPFL 연구진이 CVPR에서 GPS가 작동하지 않는 도심 환경에서 자율 주행 차량의 위치 오차를 28% 줄이는 FG2라는 새로운 AI 모델을 발표했다. 고층 빌딩으로 가려진 GPS 신호로 인해 위치 오차가 발생하는 도시에서 자율 주행 차량이나 배송 로봇에게는 중요한 기술이다.

2025년 6월 16일 오전 12시 26분

OThink-R1: LLMs에서 중복 계산을 줄이기 위한 이중 모드 추론 프레임워크

최근 LLMs는 복잡한 작업을 해결하기 위해 상세한 CoT 추론을 사용하여 최고의 성능을 달성하고 있지만, 많은 간단한 작업들은 더 적은 토큰을 사용하는 작은 모델로 해결될 수 있어서 이러한 복잡한 추론이 불필요해졌다. 이는 우리가 쉬운 문제에 대해 빠르고 직관적인 응답을 사용하는 인간의 사고와 일치한다.

2025년 6월 15일 오전 2시 26분

TinyDev를 활용한 Plan → Files → Code 워크플로우로 AI 기반 애플리케이션 구축하기

TinyDev 클래스 구현을 통해 AI 코드 생성 도구를 소개하며, 간결하면서 강력한 Gemini API를 활용하여 간단한 앱 아이디어를 포괄적이고 구조화된 애플리케이션으로 변환하는 방법을 안내한다. Plan → Files → Code의 3단계 워크플로우를 따르며 일관성, 기능성 및 모듈식 설계를 보장한다.

2025년 6월 15일 오전 2시 00분

NBA 결승전 중 AI로 만들어진 광고 방영, 제작 비용 95% 절감

AI 필름 제작자와 첨단 생성 비디오 모델이 협력하여 국내 TV 광고를 제작하고, 제작 비용을 95% 절감했다. 광고와 AI 분야에 있어서 의미 있는 순간.

2025년 6월 15일 오전 1시 02분

Microsoft AI가 코드 연구원 소개: 대규모 시스템 코드 및 커밋 기록을 위한 심층 연구 에이전트

소프트웨어 개발에서 AI의 사용이 커지면서 대형 언어 모델(LLMs)의 등장으로 코딩 관련 작업을 수행할 수 있는 모델이 개발되었습니다. 이러한 변화로 자율 코딩 에이전트가 설계되어 전통적으로 수행되던 작업을 지원하거나 자동화합니다.

2025년 6월 15일 오전 12시 37분

내부 일관성 최대화 (ICM): LLM을 위한 레이블 없는 비지도 학습 프레임워크

사전 훈련된 언어 모델(LMs)을 위한 사후 훈련 방법은 인간 감독을 필요로 하는데, 이는 작업과 모델 행동이 매우 복잡해지면 신뢰성이 떨어지는 한계를 가지고 있다. 이에 레이블 없는, 비지도 학습 프레임워크인 내부 일관성 최대화(ICM)가 소개되었다.

2025년 6월 14일 오후 4시 28분

MemOS: 진화하는 대형 언어 모델을 위한 메모리 중심 운영 체제

대형 언어 모델은 인공 일반 지능(AGI)을 달성하는 데 핵심 요소로 인식되지만 메모리 처리 방식에 대한 주요 제한 사항이 있습니다. MemOS는 외부 지식을 통합하여 정보를 오래 보관하거나 업데이트하는 데 어려움을 겪는 대부분의 대형 언어 모델의 한계를 극복하기 위한 메모리 중심 운영 체제입니다.

2025년 6월 14일 오전 10시 23분

Sakana AI, 작업 설명에 기반한 작업별 LLM 어댑터 생성하는 Text-to-LoRA (T2L) 소개

Sakana AI는 Text-to-LoRA (T2L)을 소개했다. 이는 작업 설명에 기반해 작업별 LLM 어댑터를 생성하는 하이퍼네트워크로, 새로운 특화 작업에 대한 모델 적용을 단순화한다.

2025년 6월 14일 오전 1시 03분

CVPR 2025에서 주목받은 구글 딥마인드의 ‘모션 프롬프팅’ 논문, 세밀한 비디오 제어 가능성 발표

비디오 생성을 위한 세밀한 제어는 광고, 영화 제작, 대화형 엔터테인먼트 시장에서의 확산을 위해 중요한 장벽이다. 텍스트 프롬프트는 제어의 주요 수단이지만 동적인 움직임을 명확히 하는 데 한계가 있다.

2025년 6월 14일 오전 12시 30분

OpenThoughts: 추론 모델을 위한 확장 가능한 지도학습 Feine-Tuning SFT 데이터 정제 파이프라인

최근 추론 모델들은 지도학습 Feine-Tuning (SFT)과 강화 학습 (RL)과 같은 기술을 활용하여 수학, 코딩, 과학 분야에서 높은 성능을 보여주고 있으나 이러한 선두적인 추론 모델들의 완벽한 방법론은 공개되어 있지 않다.

2025년 6월 13일 오후 11시 49분

Daytona SDK를 활용한 안전한 AI 코드 실행 워크플로우 구축

Daytona SDK를 사용하여 안전한 샌드박스 환경에서 신뢰할 수 없거나 AI로 생성된 Python 코드를 Notebook 내에서 안전하게 실행하는 방법을 안내하는 튜토리얼. 샌드박스 생성, 코드 실행, 프로세스 격리, 종속성 설치, 간단한 스크립트 실행 등을 다룸.

2025년 6월 13일 오전 1시 15분

Apple 연구원들, 퍼즐 기반 평가를 통해 대규모 추론 모델의 구조적 결함 발표

Apple 연구원들은 대규모 추론 모델인 LRMs의 구조적 결함을 퍼즐 기반 평가를 통해 밝혔다. 최근 AI는 인간과 유사한 사고를 시뮬레이션하는데 초점을 맞춘 고급 모델로 발전하고 있다.

2025년 6월 13일 오전 12시 32분

구글 AI, 정확한 지역 기후 위험 예측을 위한 하이브리드 AI-물리 모델 발표

전통적인 기후 모델링의 한계를 극복하기 위해 구글 AI가 하이브리드 AI-물리 모델을 개발했다. 이 모델은 지역 기후 위험을 더 정확하게 예측하고 더 나은 불확실성 평가를 제공한다.

2025년 6월 12일 오후 11시 46분

VLM-R³: 시각-언어 작업에서 영역 인식, 추론 및 정제를 위한 다중 모달 프레임워크 소개

VLM-R³는 시각과 언어 정보를 통합하여 기계가 다이어그램 내의 수학 문제 해결, 사진에서의 표지판 해석, 과학적 차트 해석 등 다중 모달 추론 능력을 갖추도록 돕는 프레임워크이다. 이는 인간의 사고과정을 모방하는데 도움이 되며 시각적 해석과 논리적 진행이 필요한 작업에 적합하다.

2025년 6월 12일 오후 9시 17분

Meta AI, V-JEPA 2 공개: 이해, 예측, 계획을 위한 오픈 소스 자기 지도 세계 모델

Meta AI가 V-JEPA 2를 소개했다. 이는 인터넷 규모의 비디오에서 학습하고 강력한 시각적 이해, 미래 상태 예측, 제로샷 계획을 가능하게 하는 확장 가능한 오픈 소스 세계 모델이다.

2025년 6월 12일 오전 4시 09분

Dagger를 사용하여 컨테이너를 이용해 병렬로 여러 AI 코딩 에이전트 실행하기

AI 기반 개발에서 코딩 에이전트는 필수적인 협업자로 자리 잡았다. 이러한 독립적 또는 준자율적 도구는 코드를 작성, 테스트, 리팩토링하여 개발 주기를 현격히 가속화한다. 그러나 하나의 코드베이스에서 작업하는 에이전트 수가 증가함에 따라 의존성 충돌, 에이전트 간의 상태 누출, 각 에이전트의 작업 추적의 어려움도 커진다.

2025년 6월 12일 오전 3시 18분

CURE: LLM에서 코드 및 단위 테스트 생성을 위한 강화 학습 프레임워크

대형 언어 모델(Large Language Models, LLMs)은 강화 학습과 테스트 시간 스케일링 기술을 통해 추론과 정밀도에서 상당한 향상을 보여주고 있다. 이에 대해 기존 방법들보다 우수한 성능을 보이는 CURE라는 강화 학습 프레임워크가 소개되었는데, 이는 코드 및 단위 테스트 생성에 있어 ground-truth 코드로부터의 감독을 필요로 하지 않아 데이터 수집 비용을 줄이고 사용 가능한 훈련 데이터의 규모를 제한하지 않는다.

2025년 6월 11일 오후 10시 30분

Riza와 Gemini를 활용하여 안전한 Python 실행으로 다기능 AI 에이전트 개발하기

본 튜토리얼에서는 Riza의 안전한 Python 실행을 기반으로 강력한 다기능 AI 에이전트를 Google Colab에서 구축하는 방법을 안내합니다. Riza 자격 증명을 구성하여 검사 가능한 코드 실행을 가능하게하고, LangChain 에이전트에 Riza의 ExecPython 도구를 통합합니다.

2025년 6월 11일 오후 4시 48분

LLM이 실제로 어떻게 추론하는가? 지식과 논리를 분리하는 프레임워크

최근의 LLM 발전은 복잡한 작업에서 뚜렷한 개선을 이끌어내었지만, 이 모델들의 단계적 추론 과정은 여전히 불분명하다. 대부분의 평가는 최종 답변 정확도에 초점을 맞추어 추론 과정을 숨기고 모델이 지식을 어떻게 결합하는지를 나타내지 않는다.

2025년 6월 11일 오후 4시 12분

Mistral AI, 기업 및 오픈 소스 애플리케이션용 고급 Chain-of-Thought LLMs인 Magistral 시리즈 출시

Mistral AI가 최신 시리즈인 Magistral을 소개했다. 이는 추론에 최적화된 대형 언어 모델(Large Language Models)로 LLM 능력 발전의 중요한 한 걸음이다. Magistral 시리즈에는 Apache 2.0 라이선스 하에 공개된 24B-파라미터의 Magistral Small과 기업용 Magistral Medium이 포함되어 있다.

2025년 6월 11일 오전 5시 25분

NVIDIA 연구진, 트랜스포머 LLM에서 8배 KV 캐시 압축을 위한 다이나믹 메모리 희박화(DMS) 소개

NVIDIA와 대학 연구진이 최근 논문에서, 큰 언어 모델이 더 긴 시퀀스 또는 병렬 추론 체인을 생성하기를 요구함에 따라, 추론 시간 성능이 토큰 수뿐 아니라 키-값(KV) 캐시의 메모리 풋프린트에 의해 심각하게 제한되는 문제를 다루었다.

2025년 6월 11일 오전 4시 11분

언어 모델은 정말로 얼마나 많은 정보를 기억할까? 메타의 새로운 프레임워크가 비트 레벨에서 모델 용량을 정의합니다

최신 언어 모델은 훈련 데이터를 의미있게 기억하는지에 대한 논란이 있습니다. 메타의 새로운 프레임워크는 모델의 용량을 비트 수준에서 정의하여 이 문제를 다루고 있습니다.

2025년 6월 11일 오전 1시 56분

ether0: 24B LLM가 고급 화학 추론 작업을 위해 강화 학습 RL로 훈련됨

LLM은 사전 훈련 데이터와 컴퓨팅 리소스의 스케일링을 통해 정확성을 향상시키지만, 한정된 데이터로 인해 대체 스케일링으로의 관심이 이동되었다. 최근에는 강화 학습 (RL) 후 훈련이 사용되었다. 과학적 추론 모델은 CoT 프롬프팅을 통해 초기에 답변 이전에 사고 과정을 내보내는 방식으로 성능을 향상시킨다.

2025년 6월 10일 오후 3시 33분

Meta가 LlamaRL을 소개: 효율적인 규모 확장 LLM 훈련을 위한 PyTorch 기반 강화 학습 RL 프레임워크

강화 학습은 대형 언어 모델 (LLM)을 미세 조정하는 데 강력한 방법으로 등장했다. 이 모델은 이미 요약부터 코드 생성까지 다양한 작업을 수행할 수 있으며, RL은 구조화된 피드백을 기반으로 출력을 조정하여 지능적인 행동을 더욱 향상시킨다.

2025년 6월 10일 오후 2시 40분

2025년 AI 주도 소프트웨어 개발을 변화시키는 최고의 15가지 Vibe 코딩 도구

AI-주도 개발이 소프트웨어 제작을 재정의함에 따라, “vibe 코딩”이 개발자가 원하는 대로 말하면 에이전트가 구축하는 패러다임 전환적 방법으로 등장했다. Andrej Karpathy가 만든 용어는 코드 중심적 워크플로우에서 자연어 기반 소프트웨어 프로토타이핑으로의 전환을 반영한다. 신뢰할만한 vibe 코딩 도구 목록을 소개한다.

2025년 6월 10일 오전 4시 31분

Gemini를 활용한 Pandas와 LangChain으로 자연어 데이터 분석용 DataFrame 에이전트 만들기

Google의 Gemini 모델과 Pandas의 유연성을 결합하여 타이타닉 데이터셋을 분석하는 방법을 학습합니다. ChatGoogleGenerativeAI 클라이언트와 LangChain의 Pandas DataFrame 에이전트를 결합하여 자연어 쿼리를 해석하는 상호작용 가능한 “에이전트”를 설정합니다.

2025년 6월 10일 오전 3시 19분

텍스트에서 행동으로: 도구 보강 AI 에이전트가 추론, 기억 및 자율성으로 언어 모델을 재정의하는 방법

도구 보강 에이전트의 등장으로 언어 모델이 외부 API 및 서비스를 활용하여 정확한 작업(산술 계산 또는 실시간 데이터 조회)을 수행할 수 있게 되었으며, 이는 언어 이해의 폭과 기능을 효과적으로 결합하고 있다.

2025년 6월 10일 오전 12시 07분

VeBrain: 시각 추론과 현실 세계 로봇 제어를 위한 통합 멀티모달 AI 프레임워크

VeBrain은 로봇 팔과 다리로 등장하는 기계들이 주변 환경을 인식하고 상황을 해석하며 의미 있는 조치를 취할 수 있도록하는 ML 모델의 통합을 통해 로봇 공학 분야를 발전시키고 자율적인 기계로 나아가고 있다.

2025년 6월 9일 오후 11시 40분

알케미스트 출시: 텍스트-이미지 T2I 모델 품질 향상을 위한 소형 감독 미세 조정 데이터셋

알케미스트는 텍스트-이미지(T2I) 생성 분야에서 일관된 출력 품질을 달성하는데 도움을 주는 감독 미세 조정 데이터셋으로, 대규모 사전 훈련만으로는 높은 품질과 정렬을 달성하기 어렵다는 도전에 대응한다. DALL-E 3, Imagen 3, Stable Diffusion 3과 같은 모델의 발전에도 불구하고, 미학적 및 정렬 측면에서 일관된 출력 품질을 달성하는 것은 여전히 과제다.

2025년 6월 9일 오후 2시 42분

Mistral 에이전트 API의 핸드오프 기능을 활용한 스마트 멀티 에이전트 워크플로우 생성 방법

Mistral 에이전트 API의 핸드오프 기능을 활용하여 스마트하고 멀티 에이전트 워크플로우를 만드는 방법을 살펴본다. 이를 통해 다른 에이전트들이 서로 작업을 전달하면서 복잡한 문제를 모듈화되고 효율적인 방식으로 해결할 수 있다. 인플레이션 관련 질문에 답변하기 위해 협업하는 에이전트 시스템을 구축할 것이다.

2025년 6월 9일 오전 3시 22분

ALPHAONE: AI 모델의 추론을 조절하는 범용 테스트 시간 프레임워크

대형 언어 모델에 의해 자주 사용되는 대형 추론 모델은 수학, 과학 분석 및 코드 생성의 고수준 문제를 해결하는 데 사용된다. 이중 모드 사고는 간단한 추론에 대한 신속한 응답과 복잡한 문제에 대한 신중하고 느린 사고를 모방한다. 이는 사람들이 직관적인 응답에서 복잡한 문제로 전환하는 방식을 반영한다.

2025년 6월 9일 오전 3시 07분

강화 학습에서 검증 가능한 보상을 통해 고엔트로피 토큰 선택 (RLVR)이 LLM의 정확성 향상과 훈련 비용 절감에 도움이 됩니다

대형 언어 모델(LLMs)은 각 토큰이 일관된 논리적 설명에 기여하는 Chain-of-Thoughts(CoTs)을 생성한다. 이러한 추론의 품질을 향상시키기 위해 다양한 강화 학습 기술이 사용되고 있으며, 이를 통해 모델은 생성된 출력을 정확성 기준과 일치시키는 피드백 메커니즘으로 학습할 수 있다.

2025년 6월 8일 오후 9시 38분

연구, 분석 및 검증 작업을 위해 Gemini를 활용한 비동기 AI 에이전트 네트워크 구축 방법

Gemini 에이전트 네트워크 프로토콜을 소개하는 튜토리얼. Google의 Gemini 모델을 활용하여 AI 에이전트 간의 지능적인 협업을 가능하게 하는 프레임워크로, 분석가, 연구원, 합성기 및 검증자 역할을 가진 에이전트들 사이의 동적 통신을 용이하게 함.

2025년 6월 8일 오후 4시 31분

구글, Gemini 2.5와 LangGraph를 활용한 오픈소스 풀 스택 AI 에이전트 스택 소개

대화형 AI 연구 보조기의 필요성, 최신 대형 언어 모델의 한계와 동적 AI 에이전트 스택 소개

2025년 6월 8일 오후 3시 56분

50+ 모델 컨텍스트 프로토콜 (MCP) 서버 탐색 가치

모델 컨텍스트 프로토콜(MCP)은 2024년 11월에 Anthropic에 의해 소개되었으며, AI 모델이 JSON-RPC 2.0 기반의 프로토콜을 통해 외부 도구와 상호 작용할 수 있도록 하는 표준화된 안전한 인터페이스를 제공한다. Claude, Gemini, OpenAI에서 이미 MCP를 지원하고 있으며, 빠르게 채택되고 있다.

2025년 6월 8일 오전 4시 09분

Mistral 에이전트에서 표준 JSON 스키마 형식을 사용하여 함수 호출 활성화하는 방법

Mistral 에이전트에서 함수 호출을 활성화하는 방법을 살펴보는 튜토리얼. 함수의 입력 매개변수를 명확한 스키마로 정의하여 사용자 정의 도구를 에이전트에서 호출 가능하게 만들어 강력하고 동적인 상호작용을 가능하게 함. AviationStack API를 사용하여 실시간 항공편 상태를 검색.

2025년 6월 8일 오전 3시 13분

생물학 분야에서 AI가 생물학 전문가처럼 유전체에 대해 추론할 수 있게 해주는 세계 최초의 추론 모델 ‘BioReason’ 만나보기

AI를 유전체 연구에 활용하는 주요 장애물 중 하나는 복잡한 DNA 데이터로부터 해석 가능한 단계별 추론의 부족이다. BioReason은 생물학 메커니즘에 대한 통찰력을 제공하는 세계 최초의 추론 모델로, 기존의 DNA 모델이 가진 한계를 극복하고, 유전체에 대한 복잡한 추론을 가능하게 한다.

2025년 6월 8일 오전 2시 02분

구글 AI가 멀티 에이전트 시스템 검색 MASS를 소개: 더 나은 프롬프트와 토폴로지를 위한 새로운 AI 에이전트 최적화 프레임워크

멀티 에이전트 시스템은 여러 대형 언어 모델을 조정하여 복잡한 문제를 해결하는 데 중요해지고 있다. 단일 모델의 관점에 의존하는 대신, 이러한 시스템은 역할을 에이전트 사이에 분배하여 각각이 고유한 기능을 기여하게 한다. 이렇게 노동 분업이 시스템의 분석 및 응답 능력을 향상시킨다.

2025년 6월 7일 오후 7시 52분

바이트댄스 연구진, 더 빠르고 효율적인 이미지 생성을 위한 1D 코어스 투 파인 자기회귀 프레임워크 ‘디테일플로우’ 소개

바이트댄스 연구진이 자기회귀 이미지 생성을 위한 1차원 코어스 투 파인 프레임워크 ‘디테일플로우’를 소개했다. 이 방법은 이미지를 한 토큰씩 생성함으로써 구조적 일관성을 유지하면서 이미지를 생성하는 혁신적인 방법이다.

2025년 6월 7일 오전 2시 33분

고급 분석을 위한 Google Gemini-1.5-Flash와의 고급 SerpAPI 통합에 대한 포괄적인 코딩 튜토리얼

본 튜토리얼에서는 SerpAPI의 Google 검색 기능과 Google Gemini-1.5-Flash 모델의 기능을 결합하여 Google Colab 노트북 내에서 고급 연구 및 분석 워크플로우를 생성하는 방법을 보여줍니다. AdvancedSerpAPI Python 클래스를 정의함으로써 사용자는 일반 웹 결과, 뉴스 기사, 이미지 등을 다루는 향상된 검색 방법에 액세스할 수 있습니다.

2025년 6월 6일 오후 5시 17분

Darwin Gödel Machine: Foundation 모델과 실제 벤치마크를 사용하여 코드를 진화시키는 자가 개선 AI 에이전트

기존 인공지능 시스템은 고정된 구조로 한정되어 있지만, Darwin Gödel Machine은 지속적인 개선을 통해 코드를 진화시키는 자가 개선 AI 에이전트이다. 이 모델은 인간의 과학적 진보에서 영감을 받아 지속적인 개선과 누적으로 작동한다.

2025년 6월 6일 오후 1시 31분

알리바바 Qwen 팀, Qwen3-Embedding 및 Qwen3-Reranker 시리즈 공개 – 다국어 임베딩 및 랭킹 표준 재정의

알리바바의 Qwen 팀이 Qwen3-Embedding 및 Qwen3-Reranker 시리즈를 발표했다. 이는 다국어 임베딩 및 랭킹 표준을 재정의하여 현대 정보 검색 시스템에 기초를 제공한다. 현재 접근 방식은 고다국어 충실성 및 작업 적응성을 달성하는 데 어려움을 겪고 있지만, Qwen3 시리즈는 이러한 문제를 극복하고 있다.

2025년 6월 6일 오전 12시 24분

AI에게 ‘모르겠다’라고 가르치기: 새로운 데이터셋이 강화 세밀 조정에서 환각을 줄입니다

강화 세밀 조정은 보상 신호를 사용하여 대형 언어 모델이 바람직한 동작을 하도록 안내합니다. 이 방법은 올바른 응답을 강화함으로써 모델이 논리적이고 구조화된 출력을 생성하는 능력을 강화합니다. 그러나 이러한 모델이 불완전하거나 오도하는 질문을 마주했을 때 응답하지 말아야 하는 시점을 알고 있는지 확인하는 것이 여전히 도전입니다.

2025년 6월 6일 오전 12시 02분

LangGraph와 Gemini를 활용한 반복적 AI 워크플로우 에이전트 구축 단계별 코딩 가이드

이 튜토리얼에서는 LangGraph와 Gemini 1.5 Flash를 사용하여 다단계 지능형 쿼리 처리 에이전트를 구축하는 방법을 보여줍니다. 각 노드는 라우팅, 분석, 연구, 응답 생성 및 유효성 검사로 구성된 목적 노드 시리즈를 통해 들어오는 쿼리를 처리합니다.

2025년 6월 5일 오후 5시 04분

클릭부터 추론까지: WebChoreArena 벤치마크, 메모리 집중과 멀티페이지 작업으로 에이전트 도전

웹 자동화 에이전트는 인공지능 분야에서 점점 더 주목받고 있는데, 이는 그들이 디지털 환경에서 인간과 유사한 작업을 수행할 수 있는 능력 때문이다. 이러한 에이전트들은 그래픽 사용자 인터페이스(GUI)를 통해 웹사이트와 상호작용하며, 클릭, 타이핑, 다중 웹 페이지 탐색 등과 같은 인간의 행동을 모방한다. WebChoreArena 벤치마크는 에이전트에게 메모리 집중적이고 멀티페이지 작업을 제공하여 도전한다.

2025년 6월 5일 오후 4시 10분

Salesforce AI, CRMArena-Pro 소개: LLM 에이전트를 위한 최초의 멀티턴 및 기업급 벤치마크

LLM으로 구동되는 AI 에이전트는 CRM과 같은 복잡한 비즈니스 업무를 처리하는 데 큰 잠재력을 보여준다. 그러나 실제 세계에서의 효과를 평가하는 것은 공개적이고 현실적인 비즈니스 데이터의 부족으로 어렵다. 기존의 벤치마크는 종종 간단한 일회성 상호작용이나 고객 서비스와 같은 좁은 응용에 초점을 맞추어 실제 업무를 놓치고 있다.

2025년 6월 5일 오후 3시 52분

2025년에 읽을 인공지능 인공지능 도서 Top

인공지능이 크게 발전해왔고 대형 언어 모델의 등장으로 성장의 주요 이정표를 찍었다. 최신 트렌드를 따라가는 한 가지 방법은 독서다. 2025년에 읽을 인공지능 도서를 소개한다.

2025년 6월 5일 오전 3시 15분

NVIDIA가 ProRL을 소개: 장기간 강화학습이 추론과 일반화를 향상시킴

NVIDIA는 ProRL을 소개하며 장기간 강화학습이 언어 모델의 새로운 추론 능력을 발휘하고 일반화를 향상시킨다. 최근 추론 중심 언어 모델의 발전으로 AI에서 시험 시간 계산의 규모가 커졌다. 강화학습은 추론 능력을 향상시키고 보상 조작 함정을 완화하는 데 중요하다. 하지만 기본 모델에서 새로운 추론 능력을 제공하는지 아니면 기존 솔루션의 샘플링 효율을 최적화하는 데 도움을 주는지에 대한 논쟁이 남아있다.

2025년 6월 5일 오전 2시 09분

H 회사, 개발자를 위한 Runner H 공개 베타 버전과 Holo-1 및 Tester H 발표

파리 기반의 H 회사가 Agentic AI를 현실로 구현하기 위해 3가지 주요 단계를 발표했다. Runner H 공개 베타 버전과 함께 Holo-1과 Tester H도 공개되었다.

2025년 6월 5일 오전 1시 44분

Mistral AI가 Mistral Code를 소개: 기업 워크플로에 맞춘 사용자 지정 AI 코딩 어시스턴트

Mistral AI가 기업 소프트웨어 개발 환경에 맞춘 AI 코딩 어시스턴트인 Mistral Code를 발표했다. 이 릴리스는 Mistral이 프로페셔널 개발 파이프라인에서의 제어, 보안 및 모델 적응성에 대응하고자 하는 의지를 보여준다. Mistral Code는 기존의 AI 코딩 도구에서 관측된 주요 제약 사항을 대상으로 한다.

2025년 6월 4일 오후 2시 52분

LLM 기반 에이전트의 지속적 학습을 평가하는 벤치마크인 LifelongAgentBench

현재 LLM 기반 에이전트는 기억력이 부족하고 모든 작업을 처음부터 다시 시작하는 문제가 있다. LifelongAgentBench는 지속적 학습을 평가하기 위한 벤치마크로, 지난 경험을 통해 학습할 수 없는 상태인 LLM 기반 에이전트들의 한계를 보완하고 일반 지능으로 나아가는 진정한 발전을 목표로 한다.

2025년 6월 4일 오후 2시 37분

NVIDIA AI, Llama Nemotron Nano VL 출시: 문서 이해를 위한 최적화된 소형 Vision-Language 모델

NVIDIA가 Llama Nemotron Nano VL을 소개했다. 이는 문서 수준 이해 작업에 효율적이고 정확한 비전-언어 모델(VLM)로, 복잡한 문서 구조의 정확한 구문 분석이 필요한 애플리케이션을 대상으로 한다.

2025년 6월 4일 오전 2시 47분

Tavily와 Gemini AI로 고급 웹 인텔리전스 에이전트 구축하는 코딩 구현

이 튜토리얼에서는 Tavily와 구글 Gemini AI를 활용한 고급 대화형 웹 인텔리전스 에이전트를 소개한다. 웹 페이지에서 구조화된 콘텐츠를 추출하고 AI 기반 분석을 수행하여 통찰력 있는 결과를 제공하는 스마트 에이전트를 구성하고 사용하는 방법을 배운다.

2025년 6월 4일 오전 2시 03분

MiMo-VL-7B: 일반 시각 이해 및 다중 모달 추론 강화를 위한 강력한 비전-언어 모델

비전-언어 모델(VLMs)은 다중 모달 AI 시스템의 기초 구성 요소로, 시각 환경을 이해하고 다중 모달 콘텐츠를 추론하며 디지털과 물리적 세계와 상호 작용할 수 있게 함. MiMo-VL-7B는 일반 시각 이해와 다중 모달 추론을 강화하기 위한 강력한 모델로, 연구진은 새로운 아키텍처 설계와 교육 방법론에 대한 연구를 통해 분야에서의 신속한 발전을 이끌고 있음.

2025년 6월 2일 오전 11시 50분

세계 최대 규모의 이벤트 데이터셋 Yambda 만나보기: 추천 시스템 가속화

야н덱스가 Yambda를 공개하여 추천 시스템 연구 및 개발을 가속화하는데 기여했다. 이 데이터셋은 약 50억 건의 익명 사용자 상호 작용 이벤트를 제공하며 학술 연구와 산업 규모 응용 프로그램 간의 간극을 줄이는 데 도움이 된다.

2025년 6월 2일 오전 3시 31분

NVIDIA AI, Fast-dLLM 소개: KV 캐싱 및 병렬 디코딩을 Diffusion LLMs에 적용하는 훈련 불필요한 프레임워크

Diffusion 기반 대형 언어 모델은 전통적인 자기 회귀 모델에 대안으로 탐구되고 있으며, 동시 다중 토큰 생성의 잠재력을 제공한다. 그러나 이러한 모델은 경쟁력 있는 추론을 제공하는 데 어려움을 겪는다.

2025년 6월 2일 오전 1시 10분

Off-Policy Reinforcement Learning RL with KL Divergence는 대형 언어 모델에서 우수한 추론 능력을 제공합니다

정책 기울기 방법은 특히 강화 학습을 통해 LLM의 추론 능력을 크게 향상시켰습니다. 이들 방법을 안정화하는 데 중요한 도구는 Kullback-Leibler (KL) 정규화인데, 현재 정책과 참조 정책 사이의 급격한 변화를 억제합니다. PPO와 같은 알고리즘에서 널리 사용되지만, 다양한 KL 변형에 대해 더 탐구할 여지가 많습니다.

2025년 6월 2일 오전 12시 50분

Jina Search, LangChain 및 Gemini를 활용한 지능형 AI 어시스턴트의 코딩 구현

LangChain, Gemini 2.0 Flash 및 Jina Search 도구를 통합하여 지능형 AI 어시스턴트를 구축하는 방법을 보여주는 튜토리얼. 강력한 대형 언어 모델과 외부 검색 API의 기능을 결합하여 최신 정보 및 인용을 제공하는 어시스턴트를 생성함.

2025년 6월 1일 오후 3시 18분

데스크톱 커맨더 MCP 서버 사용 안내

데스크톱 커맨더 MCP 서버는 MCP 파일 시스템 서버를 기반으로 한 강력한 도구로, 모든 개발 작업을 하나의 채팅 인터페이스로 통합해줍니다. 파일 검색, 편집, 관리, 터미널 명령 실행, 프로세스 제어 등을 데스크톱에서 Model Context Protocol (MCP)을 사용하여 직접 수행할 수 있습니다.

2025년 6월 1일 오전 10시 30분

AI로 생성된 딥페이크의 선거 정보 조작에 대한 법적 책임

인공지능 모델을 사용하여 생성된 딥페이크가 어떻게 만들어지는지, 주로 사용되는 AI 아키텍처인 GANs와 autoencoders에 대해 설명하고 있다. 이러한 딥페이크가 선거 정보 조작에 어떤 영향을 미칠 수 있는지에 대한 법적 책임에 대해 다룬다.

2025년 6월 1일 오전 10시 24분

Enigmata의 다단계 및 혼합 훈련 강화 학습 레시피가 LLM 퍼즐 추론에서의 획기적인 성과를 이끕니다

Enigmata의 새로운 훈련 방법은 LRM을 사용하여 RL로 훈련된 대규모 추론 모델이 수학, STEM 및 코딩과 같은 복잡한 추론 작업에서 높은 성능을 보이지만, 순수한 논리 추론 기술이 필요한 다양한 퍼즐 작업을 완료하는 데 어려움을 겪는 문제에 대한 획기적인 성과를 이루고 있습니다.

2025년 6월 1일 오전 10시 14분

BOND 2025 AI 트렌드 보고서, 사용자 및 개발자의 채택이 급증함에 따라 AI 생태계가 이전보다 빠르게 성장

BOND의 최신 보고서는 2025년 5월의 인공지능 트렌드를 소개하며, AI 기술의 현재 상태와 급속한 발전에 대한 데이터 기반 스냅샷를 제시한다. 보고서는 AI 채택 속도, 기술적 향상, 시장 영향의 전례없는 속도를 강조하며, 주요 결과들을 살펴보고 있다.

2025년 5월 31일 오후 11시 12분

NovelSeek 만나보기: 가설 생성부터 실험 검증까지의 자율적 과학 연구를 위한 통합 멀티 에이전트 프레임워크

NovelSeek는 인공지능 도구들이 특정 작업을 처리하는 데 사용되는 반면, 보다 복잡하고 데이터 중심의 문제에 직면하면 발견 속도가 느려질 수 있다는 문제를 해결하기 위해 가설 생성부터 실험 검증까지 자율적으로 수행하는 통합 멀티 에이전트 프레임워크를 소개한다.

2025년 5월 31일 오후 6시 53분

마이크로소프트의 이 AI 논문은 WINA를 소개합니다: 효율적인 대규모 언어 모델 추론을 위한 훈련 무료 희소 활성화 프레임워크

대규모 언어 모델(Large language models, LLMs)은 많은 AI 기반 서비스를 구동하지만 추론 중의 계산 비용이 큰 과제로 남아있었습니다. 본 논문은 WINA라는 훈련 무료 희소 활성화 프레임워크를 소개하며, 계산 효율성과 출력 품질의 균형을 최적화하는 것이 중요한 연구 분야임을 강조합니다.

2025년 5월 31일 오후 6시 44분

Cisco의 최신 AI 에이전트 보고서, 고객 경험에 미치는 적극적 AI의 변혁적 영향 상세히 소개

씨스코의 최신 적극적 AI 보고서는 적극적 AI의 발전으로 B2B 기술 내 고객 경험(CX) 패러다임이 심변하고 있음을 제공. AI 에이전트는 자율적 의사 결정, 맥락 인식 및 적응 학습으로 특징 지어져 CX를 근본적으로 재구성하며, 이전에 이루기 어려웠던 정도의 개인화, 적극성 및 예측 능력을 제공한다.

2025년 5월 31일 오후 2시 55분

ARM 및 Ada-GRPO를 소개하는 이 AI 논문: 효율적이고 확장 가능한 문제 해결을 위한 적응 추론 모델

이 논문은 인공지능의 추론 작업이 효율적이고 확장 가능한 문제 해결을 위한 ARM과 Ada-GRPO와 같은 적응 추론 모델을 소개합니다. 대형 언어 모델이 논리 추론의 다단계를 모방하려는 노력 중에 존재하는데, 이 논리 추론 작업은 상식 이해, 수학 문제 해결 및 상징적 추론과 같은 인공지능의 기본적인 측면을 포함합니다.

2025년 5월 31일 오전 4시 18분

Agent Communication Protocol (ACP)를 활용한 확장 가능한 다중 에이전트 통신 시스템 구축을 위한 코딩 가이드

이 튜토리얼에서는 Python을 사용하여 에이전트 통신 프로토콜 (ACP)을 구현하고, 구글의 Gemini API를 활용하여 유연하고 ACP 호환성있는 메시징 시스템을 구축합니다. google-generativeai 라이브러리의 설치 및 구성부터 시작하여, 핵심 추상화, 메시지 유형, 수행, ACPMessage 데이터 클래스 등을 소개하며 에이전트 간 통신을 표준화합니다.

2025년 5월 31일 오전 3시 08분

Multimodal Foundation Models Fall Short on Physical Reasoning: PHYX Benchmark Highlights Key Limitations in Visual and Symbolic Integration

최신 다중 모달 기반 모델은 학문적 지식과 수학적 추론에 대한 벤치마크를 발전시켰으나 물리적 추론에는 한계가 있음을 PHYX 벤치마크가 강조. 기계 지능의 중요한 측면인 물리적 추론은 학문적 지식, 상징적 작업, 현실 성애를 통합하는 것을 필요로 함.

2025년 5월 30일 오후 10시 41분

« 이전 1 … 8 9 10 11 12 13 다음 »