2026년 6월 17일 수요일
오늘의 신문
2026년 6월 17일 수요일 오늘의 신문
최근 AI 에이전트 생태계에서는 외부 도구와 도메인 지식 활용을 위한 두 가지 접근법인 스킬과 모델 컨텍스트 프로토콜(MCP)이 주목받고 있다. 이들은 설정과 작업 수행 방식에서 차이를 보인다.
2026년 3월 13일 오전 4시 32분
구글 AI 연구팀이 Gemini 모델을 활용해 비정형 글로벌 뉴스에서 구조화된 역사 데이터를 추출하는 새로운 방법론 ‘Groundsource’를 발표했다. 이 프로젝트는 급작스러운 자연재해에 대한 역사 데이터 부족 문제를 해결하는 데 목적이 있다.
2026년 3월 13일 오전 4시 07분
이 튜토리얼에서는 Andrej Karpathy가 제안한 AutoResearch 프레임워크를 구글 콜랩에 맞게 구현하는 방법을 소개합니다. 자동화된 실험 파이프라인을 구축해 하이퍼파라미터 조정과 실험 추적을 자동으로 수행합니다.
2026년 3월 12일 오후 6시 46분
스탠퍼드 대학 연구진이 기기 내에서 완전히 작동하는 개인 AI 에이전트를 개발할 수 있는 오픈소스 프레임워크 'OpenJarvis'를 발표했다. 이 플랫폼은 로컬 우선 AI 시스템 구축을 위한 연구 및 배포용 인프라를 제공한다.
2026년 3월 12일 오후 5시 21분
이 튜토리얼에서는 계속해서 안전한 부분 추론 업데이트를 스트리밍하는 동안 온라인으로 생각하고 행동하는 스트리밍 의사 결정 에이전트를 구축합니다. 이는 이동하는 장애물과 이동하는 목표가 있는 동적 그리드 월드를 구현하고, 온라인 A* 플래너를 사용하여 미래 몇 단계에만 집중합니다.
2026년 3월 11일 오후 7시 44분
NVIDIA가 Nemotron 3 Super를 공개했다. 이 모델은 복잡한 다중 에이전트 응용 프로그램을 위해 설계된 놀라운 1200억 파라미터 추론 모델로, 경쟁 모델보다 5배 높은 처리량을 제공한다.
2026년 3월 11일 오후 2시 19분
구글이 Gemini Embedding 2를 발표했다. 이 모델은 텍스트 뿐만 아니라 이미지, 비디오, 오디오, 문서 등을 임베딩 공간으로 가져와 AI 개발자가 고차원 저장 및 교차 모달 검색 도전에 대처할 수 있도록 설계되었다.
2026년 3월 11일 오전 3시 18분
Fish Audio의 S2-Pro은 Fish Speech 생태계 내에서의 플래그십 모델로, 고품질의 다중 화자 합성과 150ms 미만의 대기 시간을 갖춘 오픈 아키텍처로의 전환을 대표함. 릴리스는 제로샷 보이스 클로닝과 세밀한 음성 복제를 위한 프레임워크를 제공함.
2026년 3월 11일 오전 12시 58분
이 튜토리얼에서는 간단한 작업 설명서로부터 자동으로 다른 에이전트를 설계하는 메타 에이전트를 구축합니다. 작업을 분석하고 도구를 선택하며 메모리 아키텍처를 선택하고 계획자를 구성한 다음 완전히 작동하는 에이전트 런타임을 인스턴스화하는 시스템을 구현합니다. 정적 에이전트 템플릿을 넘어서 동적이고 자가 구성되는 아키텍처를 구축합니다.
2026년 3월 11일 오전 12시 23분
NVIDIA가 Nemotron-Terminal을 공개했다. 이는 LLM 터미널 에이전트의 확장을 위한 체계적인 데이터 엔지니어링 파이프라인으로, 자율 주행 AI 에이전트 구축 경쟁에서 데이터가 병목 현상을 일으키고 있다. 새로운 모델과 훈련 전략의 불투명성은 연구자와 개발자를 고비용의 암묵적인 사이클로 몰아넣고 있다.
2026년 3월 10일 오후 4시 15분
이 튜토리얼에서는 내부 비평가와 불확실성 추정 프레임워크를 통합하여 단순한 응답 생성을 넘어진 심화된 에이전트 시스템을 구축한다. 다중 샘플 추론을 시뮬레이션하고 후보 응답을 정확도, 일관성, 안전성 측면에서 평가하며, 엔트로피, 분산, 일관성 측정을 사용하여 예측 불확실성을 양적화한다. 자신감을 균형있게 유지하기 위해 위험에 민감한 선택 전략을 구현한다.
2026년 3월 10일 오전 2시 35분
바이트댄스가 DeerFlow 2.0을 공개했다. 이 프레임워크는 '슈퍼에이전트'로 일을 제안하는 것뿐만 아니라 실행하는 기능을 갖추고 있어, 복잡한 작업을 수행할 수 있다.
2026년 3월 10일 오전 2시 10분
Andrew Ng와 그의 팀이 개발한 Context Hub은 코딩 에이전트의 정적 훈련 데이터와 현대 API의 빠르게 변화하는 현실 사이의 간극을 줄이기 위해 설계된 오픈 소스 도구입니다.
2026년 3월 9일 오후 4시 47분
Anthropic은 Claude Code를 통해 고급 에이전틱 다단계 추론 루프를 활용해 복잡한 보안 연구를 자동화하는 코드 리뷰를 소개하고 있다. 이는 AI가 보일러플레이트만 작성하는 것을 넘어서 실제로 왜 Kubernetes 클러스터가 새벽 3시에 알람을 울리는지 이해하는 AI 에이전트를 지향하는 것이다.
2026년 3월 9일 오후 4시 28분
구글 연구팀은 현재의 AI 에이전트들이 '확률적 추론' 능력을 크게 부족하다고 주장하며, 대규모 언어 모델(LLM)이 새로운 증거를 기반으로 믿음을 업데이트하는 냉정하고 단단한 논리에 대해 얼마나 고집스러운지 설명했다.
2026년 3월 9일 오전 4시 23분
이 튜토리얼에서는 Scanpy를 사용하여 단일 세포 RNA 시퀀싱 분석을 위한 완전한 파이프라인을 구축합니다. 필요한 라이브러리를 설치하고 PBMC 3k 데이터세트를 로드한 다음 품질 관리, 필터링, 정규화를 수행하여 데이터를 준비합니다. 고변동 유전자를 식별하고 차원 축소를 위해 PCA를 수행한 후 클러스터링 및 시각화를 진행합니다.
2026년 3월 9일 오전 1시 03분

최신뉴스 전체보기

Nous 연구팀, 하이브리드 추론을 사용한 Hermes 4 공개

Nous 연구팀이 Hermes 4를 발표했다. 이 모델은 순수 사후 훈련 기술을 통해 선두 수준의 성능을 달성하는데, 복잡한 문제에 대한 심층 고찰이 필요할 때 모델이 표준 응답과 명시적 추론 사이를 전환할 수 있는 하이브리드 추론을 소개했다.

2025년 8월 28일 오전 1시 03분
QuTiP를 사용한 양자 상태 진화, 감쇠 및 얽힘 동역학의 코딩 구현

이 고급 QuTiP 튜토리얼에서는 Python과 QuTiP 프레임워크를 사용하여 양자 시스템의 풍부한 동역학을 탐구합니다. 기본적인 단일 및 이중큐빗 상태를 준비한 후, 벨 페어를 포함한 핵심 양자 연산인 폴리 행렬, 하다마드 게이트, CNOT을 구현합니다. 그리고 Rabi 진동을 시뮬레이션합니다.

2025년 8월 28일 오전 12시 02분
Agentic RAG란 무엇인가? 사용 사례 및 최고의 Agentic RAG 도구들 (2025)

Agentic RAG는 대규모 언어 모델이 외부 맥락에서 결과물을 검색하고 구체화하는 전통적인 RAG의 강점과, 의사 결정 및 도구 사용을 결합한 것이다. 정적 방법과 달리, Agentic RAG는 인공지능 에이전트가 검색, 생성, 쿼리 계획, 반복적 추론을 조율하는데 특징이 있다. 이 에이전트들은 데이터 소스를 자율적으로 선택하고 쿼리를 개선하며 API/도구를 실행한다.

2025년 8월 27일 오후 6시 28분
Meta AI, 딥러닝 OSS 모델 GPT-OSS-120B를 활용한 AIME 2025에서 99.9% 달성하는 첫 AI 방법인 DeepConf 공개

Meta AI와 UCSD 연구팀이 새로운 AI 방법인 Deep Think with Confidence (DeepConf)를 소개했다. 이 방법은 병렬 사고와 자아일관성 기법을 활용하여 AI 추론을 혁신하였고, AIME 2025에서 99.9%의 성과를 이루었다. 이는 오픈소스 모델 GPT-OSS-120B를 사용하는 첫 번째 사례이다.

2025년 8월 27일 오후 12시 40분
AI 프로토콜의 진화: 왜 모델 컨텍스트 프로토콜(MCP)이 AI를 위한 새로운 HTTP가 될 수 있을까

MCP는 에이전트와 AI 어시스턴트를 위해 HTTP가 웹을 위해 한 것처럼 AI 상호 운용성의 새 시대를 열어줄 준비가 되어 있습니다. MCP는 AI 시스템을 구축, 확장, 분석하는 경우 무시할 수 없는 오픈 표준으로, 도구를 발견하고 리소스를 가져오는 데 대한 범용 계약을 제공합니다.

2025년 8월 27일 오전 3시 39분
구글 AI의 새로운 회귀 언어 모델(RLM) 프레임워크, LLM이 원시 텍스트 데이터에서 산업 시스템 성능 예측 가능하게 함

구글의 새로운 회귀 언어 모델(RLM) 접근 방식은 복잡한 피쳐 엔지니어링이나 엄격한 테이블 형식에 의존하지 않고 대용량 언어 모델(LLMs)이 원시 텍스트 데이터에서 산업 시스템 성능을 예측할 수 있게 합니다.

2025년 8월 27일 오전 3시 04분
고급 도구 사용 AI 에이전트의 코딩 구현: Semantic Kernel과 Gemini 활용

이 튜토리얼에서는 Semantic Kernel을 활용한 고급 AI 에이전트를 구축하고 Google의 Gemini 무료 모델과 결합하여 Google Colab에서 원활하게 실행합니다. Semantic Kernel 플러그인을 웹 검색, 수학 평가, 파일 I/O, 메모 작성 등의 도구로 연결하고 Gemini를 통해 구조화된 JSON 출력을 조정합니다.

2025년 8월 26일 오후 11시 36분
NVIDIA AI가 공개한 Jet-Nemotron: 추론 규모에서 98% 비용 절감을 가능케 하는 53배 빠른 하이브리드 아키텍처 언어 모델 시리즈

NVIDIA 연구자들이 대형 언어 모델 추론의 효율성 장벽을 깨고, Jet-Nemotron을 공개했는데 이 모델 시리즈는 선도적인 LLM보다 최대 53.6배 높은 생성 처리량을 제공하면서 정확도를 유지하거나 능가한다. 이는 새로운 사전 훈련을 통해 이루어진 것이 아니라는 점이 가장 중요하다.

2025년 8월 26일 오후 9시 03분
구글 AI가 Gemini 2.5 플래시 이미지를 소개: 이미지를 간단히 설명함으로써 생성하고 편집할 수 있는 새로운 모델

구글 AI는 Gemini 2.5 플래시 이미지를 공개했습니다. 이 모델은 사용자가 이미지를 설명함으로써 생성하고 편집할 수 있도록 설계되었는데, 정확하고 일관된 고품질 편집을 빠르고 광범위하게 제공하는 것이 혁신적입니다.

2025년 8월 26일 오후 3시 09분
MLSecOps(머신러닝을 위한 안전한 CI/CD)란?: 최고의 MLSecOps 도구(2025)

머신러닝이 산업을 변혁하고 금융 서비스, 의료, 자율 시스템 및 전자 상거래와 같은 다양한 분야에서 혁신을 주도하고 있지만, 조직이 ML 모델을 대규모로 운영화할 때 전통적인 소프트웨어 전달 방식인 CI/CD가 머신러닝 워크플로에 적용될 때 중요한 간극을 드러내고 있다.

2025년 8월 26일 오전 5시 02분
당신의 LLM은 이야말로 그것이 고쳐져야 하는 것보다 5배 더 느리다. 그 이유는? 비관주의 – 그리고 스탠포드 연구진이 방법을 보여주었다

AI의 빠른 세계에서 대형 언어 모델(LLMs)은 챗봇부터 코드 어시스턴트까지 모든 것을 구동한다. 그러나 당신의 LLM 추론은 응답 생성 과정이 최대 5배 더 느릴 수 있다. 이유는 출력 길이의 불확실성을 다루는 너무 조심스러운 방식 때문이다.

2025년 8월 26일 오전 3시 08분
MLE-Agent와 Ollama를 사용한 신뢰할 수 있는 엔드 투 엔드 머신러닝 파이프라인 구축하기

MLE-Agent와 Ollama를 결합하여 로컬에서 API 없이 머신러닝 워크플로우를 만드는 방법에 대한 튜토리얼. 구글 코랩에서 재현 가능한 환경을 설정하고, 합성 데이터셋을 생성한 후 에이전트를 이용해 훈련 스크립트를 작성하는 방법을 안내한다. 일반적인 실수를 방지하여 견고하게 만든다.

2025년 8월 26일 오전 12시 59분
Microsoft, VibeVoice-1.5B 공개: 4명의 다른 화자로 최대 90분 음성 합성 가능한 오픈소스 텍스트 음성 모델

Microsoft이 새로 공개한 VibeVoice-1.5B는 MIT 라이선스로 배포된 텍스트 음성(TTS) 기술의 한계를 재정의하며, 4명의 다른 화자로 최대 90분의 음성을 생성할 수 있는 유연하고 확장 가능한 모델이다.

2025년 8월 25일 오후 7시 28분
SEA-LION v4: 동남아시아를 위한 다중언어 모델링

AI Singapore가 Google과 협력하여 개발한 SEA-LION v4는 Gemma 3 (27B) 아키텍처를 기반으로 한 오픈소스 다중언어 모델이다. 주로 동남아시아 언어를 지원하며 텍스트와 이미지 이해 능력을 제공한다. SEA-LION v4는 상용 허용 라이선스를 사용한다.

2025년 8월 25일 오후 12시 16분
대규모 트랜스포머 모델 학습 시 GPU와 TPU의 차이는 무엇인가요? 벤치마크를 통한 최고의 GPU와 TPU

GPU와 TPU는 대규모 트랜스포머 모델 학습을 가속화하는 데 중요한 역할을 하지만, 핵심 아키텍처, 성능 프로필 및 생태계 호환성의 차이로 인해 사용 사례, 속도, 유연성에 중요한 영향을 미친다. TPUs는 구글이 고도로 효율적인 행렬 연산을 위해 특별히 제작한 사용자 정의 ASIC(특정 응용 프로그램 통합 회로)이며, 핵심 아키텍처와 하드웨어 기초가 다르다.

2025년 8월 25일 오전 4시 11분
구글 AI가 대화형 의료 AI에서 책임성을 강조하는 Guardrailed-AMIE (g-AMIE)를 소개했습니다

최근 대형 언어 모델 판단력을 갖춘 AI 에이전트의 발전으로, 임상 대화, 진단 및 치료 계획이 가능해졌습니다. 그러나 개별 진단과 치료 권고는 규제가 엄격하며, 중요한 환자와 직면한 결정에 대한 책임은 라이선스를 받은 임상 의사만이 가질 수 있습니다. 전통적인 의료는 종종 계층적 감독을 사용하며, 경험 많은 의사가 임상 의사의 의사결정을 검토합니다.

2025년 8월 25일 오전 3시 44분
LLM Arena-as-a-Judge 방법을 활용한 대규모 언어 모델 출력물 평가 방법 구현하기

LLM Arena-as-a-Judge 방법을 사용하여 대규모 언어 모델 출력물을 평가하는 방법을 살펴봅니다. 각 응답에 점수를 부여하는 대신, 이 방법은 도움이 되는지, 명확한지, 톤이 어떤지 등의 기준을 기반으로 출력물을 직접 비교하여 더 나은 쪽을 판단합니다.

2025년 8월 25일 오전 3시 03분
GluonTS에서 유연한 다중 모델 워크플로우 구축을 위한 코딩 가이드

GluonTS를 활용하여 복잡한 합성 데이터셋을 생성하고 다중 모델을 병렬로 적용하는 방법에 대해 다루는 튜토리얼. 다양한 추정기를 동일한 파이프라인에서 사용하고 누락된 종속성을 우아하게 처리하여 유용한 결과물을 생성하는 방법에 초점을 맞춘다. 평가 및 시각화 단계를 포함하여 결과를 분석한다.

2025년 8월 24일 오후 4시 35분
데이터베이스란? 현대 데이터베이스 유형, 예시 및 응용 (2025)

데이터 주도 세계에서 데이터베이스는 모바일 앱부터 기업 시스템에 이르기까지 현대 애플리케이션의 중추를 이룬다. 다양한 데이터베이스 유형과 그 응용을 이해하는 것은 특정한 요구 사항에 맞는 적절한 시스템을 선택하는 데 중요하며, 개인 프로젝트를 구축하거나 기업 수준의 솔루션을 설계하는 경우 필수적이다.

2025년 8월 24일 오전 5시 35분
2025년 기업용 AI 구축 vs 구매: AI 제품의 부사장을 위한 미국 시장 결정 프레임워크

미국의 기업용 AI는 실험 단계를 벗어나고 있습니다. CFO들은 명확한 투자대비효과(ROI)를 기대하고, 이사회는 리스크 감독의 증거를 요구하며, 규제기관들은 기존 리스크 관리 의무에 부합하는 통제를 기대합니다. 이 상황 속에서 모든 AI 제품의 부사장은 항상 고민해야 합니다: 이 능력을 자체 구축해야 할까요, 벤더로부터 구매해야 할까요, 아니면 두 가지를 혼합해야 할까요?

2025년 8월 24일 오전 4시 38분
Gemini를 활용한 작업 계획, 검색, 계산 및 자가 비판을 위한 그래프 구조 AI 에이전트 설계를 위한 완전한 코드 구현

이 튜토리얼에서는 GraphAgent 프레임워크와 Gemini 1.5 Flash 모델을 사용하여 고급 그래프 기반 AI 에이전트를 구현합니다. 각각 특정 기능을 담당하는 노드의 방향성 그래프를 정의하며, 작업 분해를 담당하는 계획자, 흐름 제어를 담당하는 라우터, 외부 증거 및 계산을 제공하는 연구 및 수학 노드가 있습니다.

2025년 8월 24일 오전 2시 07분
GPZ: 대규모 입자 데이터를 위한 차세대 GPU 가속 손실 압축기

입자 기반 시뮬레이션과 포인트 클라우드 응용 프로그램은 과학 및 상업 데이터 집합의 크기와 복잡성을 대규모로 확장시키고 있으며, 이를 효율적으로 축소, 저장 및 분석하는 것은 현대 GPU의 병목 현상을 방지하는 것이다. 이는 우주학, 지질학과 같은 분야에서 신흥 대규모 도전 과제 중 하나이다.

2025년 8월 24일 오전 1시 57분
Prefix-RFT: 지도 미세 조정(SFT)과 강화 학습 미세 조정(RFT)을 결합하는 통합 기계 학습 프레임워크

대형 언어 모델은 보통 사전 훈련 후 지도 미세 조정(SFT) 또는 강화 학습 미세 조정(RFT)을 사용해 개선된다. SFT는 예제 기반 학습을 통해 강의 따르기를 효과적으로 가르치지만, 엄격한 행동과 부족한 일반화로 이어질 수 있다. 반면 RFT는 보상 신호를 사용해 모델을 작업 성공을 위해 최적화하지만, […]

2025년 8월 23일 오후 8시 52분
LLMs를 위한 JSON 프롬프팅: Python 코딩 예제로 실용적 가이드

JSON 프롬프팅은 AI 모델에 명확하고 기계가 읽을 수 있는 프롬프트를 제공하는 기술이다. 기존의 텍스트 프롬프트와는 달리 JSON 프롬프트는 요구 사항을 키-값 쌍, 배열, 중첩된 객체로 구조화하여 모호함을 없애고 정확한 청사진으로 바꾼다.

2025년 8월 23일 오후 8시 34분
AI에서 음성 에이전트란 무엇인가? 알아야 할 최고의 9개 음성 에이전트 플랫폼 (2025)

음성 에이전트는 전화나 인터넷을 통해 실시간 대화를 나눌 수 있는 소프트웨어 시스템이다. 이전의 IVR 트리와 달리 음성 에이전트는 자유로운 형식의 음성을 처리하고, 중단을 다루며, 외부 도구 및 API(예: CRM, 예약 시스템, 결제 시스템)에 연결되어 작업을 완료할 수 있다.

2025년 8월 23일 오전 5시 48분
금융 기관을 위한 대형 언어 모델 LLM 대 소형 언어 모델 SLM: 2025년 실용적 기업 AI 안내서

2025년에는 대형 언어 모델(LLMs)과 소형 언어 모델(SLMs) 사이에 절대적인 승자가 없다. 은행, 보험사 및 자산 관리자들은 규제 리스크, 데이터 민감성, 대기 시간 및 비용 요구 사항, 사용 복잡성에 따라 선택해야 한다.

2025년 8월 23일 오전 5시 22분
구글 AI, 차별적인 개인 파티션 선택을 위한 혁신적인 머신러닝 알고리즘 제안

구글 AI팀은 차별적인 개인 파티션 선택을 위한 새로운 머신러닝 알고리즘을 제안했다. 이는 대규모 머신러닝 및 데이터 분석에서 사용자 정보를 보호하는 데 중요한 역할을 한다. 이 알고리즘은 엄격한 개인 정보 보호를 유지하면서 대규모 사용자 기여 데이터셋에서 고유한 항목을 안전하게 추출하는 과정을 포함한다.

2025년 8월 23일 오전 4시 15분
Native RAG 대 Agentic RAG: 기업 AI 의사 결정을 발전시키는 접근 방식은 무엇인가?

RAG 기술은 대형 언어 모델을 실시간, 도메인 특화 지식으로 강화하는 핵심 기술로 등장했다. “Native RAG”와 “Agentic RAG”의 구현이 주를 이루고 있으며, AI 기반 정보 통합과 의사 결정 지원에서 새로운 패러다임을 제시하고 있다.

2025년 8월 22일 오후 7시 11분
Huawei CloudMatrix: 확장 가능하고 효율적인 LLM 서빙을 위한 P2P AI 데이터센터 아키텍처

LLM은 파라미터 수가 급증하고 MoE 디자인과 대규모 컨텍스트 길이의 널리 사용으로 급속히 발전했습니다. DeepSeek-R1, LLaMA-4, Qwen-3 같은 모델은 이제 수조 개의 파라미터에 이르며 엄청난 컴퓨팅, 메모리 대역폭, 빠른 칩 간 통신이 요구됩니다. MoE는 효율성을 향상시키지만 전문가 라우팅에서 도전을 야기하며 백만 개 이상의 토큰을 갖는 컨텍스트 창은 […]

2025년 8월 22일 오후 6시 48분
AmbiGraph-Eval: 그래프 쿼리 생성 중의 모호성 해결을 위한 벤치마크

자연어를 SQL이나 Cypher와 같은 형식적인 쿼리 언어로 변환하는 의미 파싱은 데이터베이스와 직관적으로 상호작용할 수 있게 합니다. 그러나 자연어는 모호하고 쿼리 언어는 정확성을 요구하기 때문에 모호성은 그래프 데이터베이스에서 어려운 과제입니다.

2025년 8월 22일 오후 6시 42분
2025년 AI 개발자와 엔지니어를 위한 인기 있는 AI 블로그 및 뉴스 웹사이트 Top 10

AI 개발자와 엔지니어들에게 최신 툴, 산업 동향을 알기 위해 필수인데, 노이즈 속에서 빠르게 정보를 얻기 위해 고품질의 기술적 콘텐츠를 제공하는 상위 10개 AI 블로그와 뉴스 플랫폼을 소개합니다.

2025년 8월 22일 오전 4시 53분
Zhipu AI, 컴퓨터 사용 에이전트를 위한 엔드투엔드 강화학습 확장 AI 프레임워크 ComputerRL 공개

Zhipu AI가 ComputerRL을 소개했다. 본 프레임워크는 에이전트에게 복잡한 디지털 작업 환경을 탐색하고 조작할 능력을 부여하는 것을 목표로 한다. 이 혁신은 AI 에이전트 개발에서 핵심적인 도전 과제를 해결하는데, 즉 컴퓨터 에이전트와 인간이 디자인한 GUI 간의 연결 부재를 해소한다.

2025년 8월 22일 오전 4시 14분
Google, 추론형 데이터베이스 프로그래밍을 위한 프로그래밍 언어 ‘Mangle’ 공개

Google이 Datalog를 확장한 새 오픈소스 프로그래밍 언어 ‘Mangle’을 소개했다. Go 라이브러리로 구현된 Mangle은 여러 다른 소스에 퍼져있는 데이터에 대한 쿼리 및 추론 작업을 간단하게 만들기 위해 설계되었다. 이 릴리스는 개발자와 보안 분야에서 점점 더 커지는 도전에 대응한다.

2025년 8월 22일 오전 3시 52분
스피커 다이어라이제이션이란? 2025 기술 가이드: 2025년 최고의 9가지 스피커 다이어라이제이션 라이브러리 및 API

스피커 다이어라이제이션은 오디오 스트림을 화자 식별로 분리하여 각 세그먼트를 일관되게 레이블링하는 프로세스로, 통역을 더 명확하고 검색 가능하며 콜센터, 법률, 의료, 미디어, 대화형 AI 등 다양한 분야에서 유용하게 활용된다. 2025년 현재 현대 시스템들이 활발히 사용되고 있다.

2025년 8월 21일 오후 4시 24분
NVIDIA AI, 실시간 화자 다이어라이제이션인 스트리밍 소트포머 출시

NVIDIA의 실시간 화자 다이어라이제이션 기술인 스트리밍 소트포머가 발표되었습니다. 이 기술은 노이즈가 있는 다수 화자 환경에서도 회의, 통화, 음성 애플리케이션 참가자를 즉시 식별하고 레이블을 지정합니다. 영어와 중국어에 최적화되어 있으며 밀리초 수준의 정밀도로 최대 4명의 동시 화자를 추적할 수 있습니다.

2025년 8월 21일 오후 1시 40분
DeepSeek-V3.1가 무엇이며 왜 모두가 그에 대해 이야기하는가?

중국 AI 스타트업인 DeepSeek가 최신 주력 언어 모델인 DeepSeek-V3.1을 발표했다. DeepSeek-V3의 아키텍처를 기반으로 하여 추론, 도구 사용, 코딩 성능을 중요하게 향상시켰다. 이 모델은 저렴한 비용으로 OpenAI 및 Anthropic 수준의 성능을 제공하여 급속하게 명성을 얻고 있다.

2025년 8월 21일 오전 4시 44분
DeepCode: 연구 논문과 기술 문서를 제품용 코드로 변환하는 오픈 에이전틱 코딩 플랫폼

홍콩 대학 연구진이 출시한 DeepCode는 다중 에이전트 AI 시스템을 활용하여 연구 논문 해석부터 코딩 프로세스를 자동화하는 “오픈 에이전틱 코딩” 패러다임을 제안한다.

2025년 8월 21일 오전 3시 58분
한국의 LLM 강자 만나보기: HyperClova, AX, Solar Pro, 그리고 더

한국은 대규모 언어 모델(LLM) 분야에서 중요한 혁신가로 자리매김하고 있으며 정부 투자, 기업 연구, 오픈 소스 협력을 통해 한국어 처리 및 국내 응용 프로그램에 맞는 모델을 만들고 있다. 이는 외국 AI 기술에 대한 의존성을 줄이고 데이터 개인 정보 보호를 향상시키며 의료, 교육 등의 분야를 지원한다.

2025년 8월 21일 오전 3시 31분
Liquid AI, LFM2-VL 출시: 저지연 및 장치 인식 배포용 초고속 오픈가중치 비전-언어 모델

Liquid AI사가 저지연, 장치 내 배포를 위해 최적화된 새로운 비전-언어 기반 모델인 LFM2-VL을 공식 출시했다. LFM2-VL-450M 및 LFM2-VL-1.6B 두 가지 효율적인 변형으로, 스마트폰, 노트북, 웨어러블 및 임베디드 시스템에 다중 모달 AI를 속도나 정확도를 희생하지 않고 도입하는 중요한 발전을 이루었다.

2025년 8월 20일 오후 8시 21분
ZenFlow: 대형 언어 모델 (LLM) 학습용 스톨 프리 오프로딩 엔진으로 설계된 새로운 DeepSpeed 확장판

DeepSpeed 팀이 새로운 오프로딩 엔진인 ZenFlow를 공개했습니다. 이 엔진은 대형 언어 모델 (LLM) 학습 중 발생하는 CPU로 인한 GPU 스톨 문제를 극복하기 위해 설계되었습니다. 기존 프레임워크들과는 다르게 ZenFlow는 비싼 GPU가 훈련 단계 중 대부분을 기다리는 것을 방지합니다.

2025년 8월 20일 오후 7시 52분
2025년 PyTorch 대 TensorFlow: 심층학습 프레임워크 대결

2025년 현재 인공지능 개발에서 PyTorch와 TensorFlow 사이의 선택은 여전히 가장 논란이 되는 문제 중 하나이다. Alfaisal 대학의 종합 조사 논문을 통해 최신 동향을 탐색하며 사용성, 성능, 배포, 생태계 고려 사항을 종합적으로 분석한다.

2025년 8월 20일 오후 7시 34분
구글 AI, 개발자를 위한 5가지 새로운 AI 에이전트/플랫폼 공개

구글 클라우드가 최근에 개발자 작업을 간소화하고 수동 노력을 줄이며 분석 가속화하고 고급 데이터 및 코드 자동화의 진입 장벽을 낮추기 위해 설계된 다섯 가지 특화된 AI 에이전트를 공개했다. 각 에이전트는 데이터 파이프라인 조정부터 기업급 GitHub 관리까지 각각의 개발자 과제를 다룬다.

2025년 8월 20일 오후 1시 46분
Model Context Protocol (MCP)로의 이주: 어댑터-퍼스트 플레이북

Model Context Protocol (MCP)는 AI 모델을 다양한 애플리케이션, 시스템 및 도구에 연결하는 범용 표준으로 급속히 등장했습니다. MCP로의 이주는 사용자 정의 통합에 익숙한 기관들에게 기술적 부채를 줄이고 새로운 상호 운용성 혜택을 누릴 수 있는 변화를 가져올 수 있습니다.

2025년 8월 20일 오전 5시 24분
인사, AI 수식: 왜 =COPILOT()은 몇 년 동안 가장 큰 엑셀 업그레이드인가

Microsoft가 엑셀 for Windows와 Mac에 COPILOT 함수를 공식적으로 도입하여 대형 언어 모델의 기능을 스프레드시트로 직접 가져왔다. 사용자들은 이제 자연어를 사용하여 데이터를 분석, 요약 및 생성할 수 있다.

2025년 8월 20일 오전 3시 35분
신호와 소음: 더 나은 AI 결정을 위한 신뢰할 수 있는 LLM 평가를 해제

대형 언어 모델(Large Language Models, LLMs)을 평가하는 것은 과학적으로나 경제적으로 비용이 많이 든다. LLMs의 크기가 점점 커지면서 이를 평가하고 비교하는 방법론은 점점 중요해지고 있다. Allen Institute for Artificial Intelligence (Ai2)의 최근 연구는 두 가지 기본 요소를 중심으로 한 강력한 프레임워크를 소개했다.

2025년 8월 20일 오전 3시 09분
Ollama, REST API 및 Gradio 채팅 인터페이스를 활용한 완전한 Self-Hosted LLM Workflow 구축의 코딩 구현

본 튜토리얼에서는 Google Colab 내에 완전한 Ollama 환경을 구현하여 Self-Hosted LLM Workflow를 복제하는 방법을 제시한다. Colab VM에 공식 Linux 설치 프로그램을 사용하여 Ollama를 설치하고 localhost:11434에 HTTP API를 노출시키는 과정부터 시작하여 Ollama 서버를 배경에서 실행한다. 서비스를 확인한 후, […]

2025년 8월 20일 오전 12시 04분
M3-Agent 만나보기: 장기 기억과 향상된 추론 능력을 갖춘 다중 모달 에이전트

미래에는 가정 로봇이 일상적인 일을 스스로 처리하고 지속적인 경험을 통해 가정 패턴을 학습할 수 있을 것으로 예상된다. 다중 모달 에이전트인 M3-Agent의 지능은 계속해서 다중 모달 센서를 통해 세계를 관찰하고, 장기 기억에 경험을 저장함으로써 이에 달려있다.

2025년 8월 19일 오후 11시 52분
NVIDIA AI, Nemotron Nano 2 AI 모델 출시: 제품용 기업 AI 모델 패밀리, 유사 크기 모델보다 6배 빠름

NVIDIA가 Nemotron Nano 2 패밀리를 공개했는데, 이는 최첨단 추론 정확도를 끌어올리는 하이브리드 Mamba-Transformer 대형 언어 모델을 소개하며 유사한 크기의 모델보다 최대 6배 높은 추론 처리량을 제공합니다. 이 릴리스는 데이터 및 방법론에 대한 전례없는 투명성으로 눈에 띕니다.

2025년 8월 19일 오후 1시 40분
Memp: LLM 기반 에이전트에서 프로시저 메모리를 핵심 최적화 대상으로 끌어올리는 작업에 중립적인 프레임워크

LLM 에이전트는 웹 연구, 보고서 작성, 데이터 분석 및 다단계 소프트웨어 워크플로우와 같은 복잡한 작업을 처리하는 데 충분히 강력해졌지만, 절차적 메모리에 어려움을 겪고 있습니다. 이 프레임워크는 프로시저 메모리를 핵심 최적화 대상으로 끌어올려 에이전트를 견고하게 만듭니다.

2025년 8월 19일 오전 4시 25분
2025년을 형성하는 AI 사이버 보안 방어의 주요 트렌드: 최고의 AI 보안 도구

사이버 위협이 더욱 정교해짐에 따라 조직들은 인공지능을 중심으로 방어 전략을 재구상하고 있다. AI로 구동되는 사이버 보안 방어에서 주목해야 할 가장 중요한 트렌드를 살펴보자. AI 기반 위협 탐지와 자동 응답, 그리고 더 이상의 갈라진 방어 시대는 끝났다.

2025년 8월 19일 오전 4시 18분
블랙록, 알파에이전트 도입: 다중 에이전트 LLM 협업으로 주식 포트폴리오 구축 발전

금융 시장에서 인공지능(AI) 사용이 급증하고 있으며, 블랙록 연구팀은 투자 연구를 위해 알파에이전트를 제안했다. 알파에이전트 프레임워크는 다중 에이전트 시스템의 파워를 활용하여 투자 결과를 개선하고 인지 편향을 줄이며 의사 결정을 강화한다.

2025년 8월 19일 오전 3시 46분
데이터 엔지니어를 위한 마스터 바이브 코딩: 장단점 및 모범 사례

바이브 코딩은 대형 언어 모델 도구를 사용해 엔지니어가 명확한 영어로 파이프라인 목표를 설명하고 생성된 코드를 받는 것을 말한다. 올바르게 활용하면 프로토타이핑과 문서화를 가속화할 수 있지만 부주의하게 사용하면 데이터 손상, 보안 위험, 코드 유지 보수의 어려움을 초래할 수 있다.

2025년 8월 18일 오후 10시 02분
Qwen Team이 Qwen-Image-Edit를 소개: 시맨틱 및 외관 편집을 위한 고급 기능을 갖춘 Qwen-Image의 이미지 편집 버전

2025년 8월 알리바바의 Qwen Team이 출시한 Qwen-Image-Edit는 20B-파라미터 Qwen-Image를 기반으로 고급 편집 기능을 제공한다. 이 모델은 시맨틱 편집(스타일 전이 및 새로운 시각 합성)과 외관 편집에서 뛰어나다.

2025년 8월 18일 오후 7시 17분
McKinsey가 만든 오픈소스 파이썬 툴킷 Vizro MCP를 활용한 대시보드 생성

McKinsey의 오픈소스 파이썬 툴킷 Vizro는 몇 줄의 설정으로 멋진 대시보드를 만드는데 도움을 주며, Plotly, Dash, Pydantic 위에 구축되어 있다.

2025년 8월 18일 오후 6시 21분
AI 인프라에서 빠진 표준인 Model Context Protocol (MCP)이란?

대규모 언어 모델(Large Language Models, LLMs)을 중심으로 하는 인공지능의 급속한 성장은 기업이 고객 서비스 자동화부터 데이터 분석 향상까지 운영 방식을 혁신시켰다. 그러나 AI를 핵심 업무에 통합할 때 실제 데이터 소스에 모델을 안전하고 효율적으로 연결하는 것이 계속된 과제로 떠오르고 있다. Anthropic의 소개로 MCP가 등장함으로써 이 문제에 대한 해결책이 제시되고 있다.

2025년 8월 18일 오전 2시 57분
알리바바 AI팀, 향상된 시각 지각 및 추론 능력을 갖춘 Ovis 2.5 다중모달 LLMs 발표

알리바바 AIDC-AI팀이 최신 대형 다중모달 언어 모델 Ovis2.5를 발표했는데, 9B와 2B 매개변수 버전으로 오픈소스 AI 커뮤니티에서 주목을 받고 있다. Ovis2.5는 원본 해상도 비전 지각, 심층 다중모달 추론, 견고한 OCR을 통해 성능과 효율성에 새로운 기준을 제시하며 기존 제약을 극복하고 있다.

2025년 8월 18일 오전 2시 15분
AI 추론이란 무엇인가? 기술적인 심층 탐구 및 2025년 판매자 상위 9곳

2025년을 기준으로 AI 추론에 대한 기술적인 심층 탐구를 제공하며, 모델 훈련과 실제 응용 프로그램 간의 연결을 담당하는 추론의 핵심 기능에 대해 다룹니다. 현대 모델의 지연 문제와 최적화 전략과 같은 주제를 다룹니다.

2025년 8월 18일 오전 1시 55분
Gemini 및 mcp-agent 프레임워크를 활용한 MCP-Powered AI 에이전트 구축: 단계별 구현 가이드

이 튜토리얼에서는 mcp-agent 및 Gemini를 활용하여 고급 AI 에이전트를 구축하는 방법을 안내합니다. 필요한 모든 종속성을 갖춘 견고한 환경을 설정한 다음 웹 검색, 데이터 분석, 코드 실행 및 날씨 정보와 같은 구조화된 서비스를 제공하는 MCP 도구 서버를 구현합니다.

2025년 8월 18일 오전 1시 25분
Hugging Face, AI Sheets 공개: LLM-Powered 데이터셋을 위한 무료 오픈소스 노코드 툴킷

Hugging Face사가 AI Sheets를 출시했는데, 이는 무료이자 오픈소스이며 로컬 기반의 노코드 툴로, AI를 활용한 데이터셋 생성과 보강을 혁신적으로 간소화하는 데 목적이 있다. AI Sheets는 직관적인 스프레드시트 인터페이스를 대표하는 오픈소스 대형 언어 모델(Qwen, Kimi, Llama 3 등)과 직접적으로 결합하여 AI 기반 데이터 처리에 대한 접근성을 민주화하고 있다.

2025년 8월 17일 오후 4시 06분
오픈AI 모델을 deepteam을 사용하여 단일 턴 적대적 공격에 대해 테스트하는 방법

deepteam을 사용하여 오픈AI 모델을 단일 턴 적대적 공격에 대해 테스트하는 방법을 살펴볼 것이다. 이 튜토리얼에서는 프롬프트 주입, 탈옥, 리트스피크 등 10가지 이상의 공격 방법을 제공하는 deepteam을 이용하여 LLM 애플리케이션의 취약점을 노출시키는 방법을 다룬다.

2025년 8월 17일 오후 3시 41분
AI Red Teaming이란? 상위 18개 AI Red Teaming 도구들 (2025)

AI Red Teaming은 인공지능 시스템, 특히 생성 모델과 기계 학습 모델을 적대적 공격 및 보안 스트레스 시나리오에 대해 체계적으로 테스트하는 과정이다. Red Teaming은 전통적인 침투 테스트를 벗어나 알려지지 않은 AI 특정 취약점, 예상치 못한 위험 및 신흥 행위에 대해 조사한다.

2025년 8월 17일 오전 5시 57분
아마존의 새 AI 모델 스위트, DeepFleet을 만나보세요

아마존이 글로벌 충족 및 분류 센터에 백만 대의 로봇을 배치하며 세계 최대의 산업용 이동 로봇 운영자로 자리매김했다. 이 달성과 함께 DeepFleet이 출시되었는데, 이는 방대한 이동 로봇 군 사이의 조정을 향상시키기 위해 설계된 혁신적인 기초 모델 스위트이다.

2025년 8월 17일 오전 2시 17분
배포부터 확장까지: 현대 비즈니스를 위한 11가지 기업용 AI 기본 개념

인공지능 시대에 기업은 전례 없는 기회와 복잡한 도전에 직면하고 있습니다. 최신 도구를 채택하는 것뿐만 아니라 AI가 사람, 프로세스, 플랫폼과 어떻게 통합되는지에 대해 근본적으로 재고하는 것이 성공의 열쇠입니다. 최신 연구를 바탕으로 기업 리더가 이해해야 할 11가지 AI 개념을 소개합니다.

2025년 8월 17일 오전 1시 54분
Dagster를 활용한 머신러닝 통합 엔드 투 엔드 파티션 데이터 파이프라인 구축 및 유효성 검사를 위한 코딩 가이드

이 튜토리얼에서는 Dagster를 사용하여 고급 데이터 파이프라인을 구현한다. 맞춤형 CSV 기반 IOManager를 설정하여 자산을 보존하고, 분할된 일일 데이터 생성을 정의하며, 합성 판매 데이터를 클리닝, 피처 엔지니어링 및 모델 트레이닝을 통해 처리한다. 중간에 데이터 품질 자산 확인을 추가하여 널 값, 범위 및 범주 값 등을 유효성 검사한다.

2025년 8월 17일 오전 1시 35분
dots.ocr 만나보기: 다국어 문서 구문 분석에서 최고 수준의 성능을 달성한 새로운 1.7B 비전-언어 모델

dots.ocr은 다국어 문서 레이아웃 구문 분석과 광학 문자 인식(OCR)을 위해 개발된 오픈 소스 비전-언어 트랜스포머 모델이다. 이 모델은 단일 아키텍처 내에서 레이아웃 감지와 내용 인식을 수행하며 100여 개 언어와 다양한 구조화된 및 비구조화된 문서 유형을 지원한다.

2025년 8월 16일 오후 1시 22분
아마존, 베드록 에이전트코어 게이트웨이 공개: 기업 AI 에이전트 도구 통합 재정의

아마존 웹 서비스(AWS)가 아마존 베드록 에이전트코어 게이트웨이를 출시했다. 이는 기업용 AI 에이전트-도구 통합을 간소화하고 확장하기 위한 혁신적인 관리 서비스로, AI 에이전트를 수백 개의 도구와 서비스가 있는 점점 복잡해지는 환경에서 활용하려는 기업들의 핵심 과제를 해결한다.

2025년 8월 16일 오후 12시 47분
NVIDIA AI, 유럽어용 최대 규모 오픈소스 음성 AI 데이터셋과 첨단 모델 공개

NVIDIA가 유럽어용 Granary라는 최대 규모의 오픈소스 음성 데이터셋과 Canary-1b-v2, Parakeet-tdt-0.6b-v3 두 첨단 모델을 발표했다. 이는 특히 소수 언어에 대한 자동 음성 인식 및 음성 번역 분야에서 액세스 가능하고 고품질의 자원에 새 기준을 제시한다.

2025년 8월 16일 오전 1시 29분
R-Zero: 스스로 훈련 데이터를 생성하는 완전 자율 AI 프레임워크

대형 언어 모델이 자연어 이해부터 추론 및 코드 생성까지 다양한 분야를 혁신시켰다. 그러나 그들의 추론 능력을 실제 초인간 수준으로 끌어올리는 것은 방대하고 고품질의 인간 주석이 필요한 데이터셋 때문에 제한되어 왔다. Tencent AI Seattle Lab, Washington 대학, Maryland 대학 및 […] 연구진이 자체 훈련 데이터를 생성하는 완전 자율 AI 프레임워크인 R-Zero를 개발했다.

2025년 8월 16일 오전 12시 19분
ReaGAN: 노드에 자율 계획과 전역 의미 검색 기능을 부여하는 그래프 에이전트 네트워크인 AI 논문 소개

Rutgers 대학 연구팀이 소개한 ReaGAN은 각 노드를 독립적인 추론 에이전트로 재구상하는 그래프 에이전트 네트워크로, 그래프 내 모든 노드를 인공지능 에이전트로 만들어 맞춤형 추론, 적응적 검색, 자율적 의사 결정을 가능케 한다.

2025년 8월 16일 오전 12시 06분
Salesforce AI가 Moirai 2.0를 발표: Salesforce의 최신 타임 시리즈 기반 모델은 디코더 전용 트랜스포머 아키텍처로 구축되었습니다

Salesforce AI Research가 Moirai 2.0을 공개했다. 이는 타임 시리즈 기반 모델의 최신 진보로, 디코더 전용 트랜스포머 아키텍처 위에 구축되어 성능과 효율성에서 새로운 기준을 세우며 GIFT-Eval 벤치마크에서 1위를 차지했다.

2025년 8월 15일 오후 4시 27분
Parsl를 활용한 다중 도구 AI 에이전트 실행을 위한 지능적인 병렬 워크플로우 디자인 구현 가이드

본 튜토리얼에서는 Parsl을 사용하여 병렬 실행 능력을 활용하여 여러 계산 작업을 독립적인 Python 앱으로 실행하는 AI 에이전트 파이프라인을 구현한다. 로컬 ThreadPoolExecutor를 구성하여 동시성을 활용하고, 피보나치 계산, 소수 계산, 키워드 추출, 시뮬레이션 API 호출과 같은 특수 도구를 정의하고, 가벼운 플래너를 통해 조정한다.

2025년 8월 15일 오후 2시 27분
2025년 유럽의 최고 AI 모델: 다국어, 오픈, 기업용

2025년 유럽의 AI 생태계는 오픈 이노베이션, 다국어 기능, 기업용 추론으로 강력해졌다. 이 기사는 해당 지역에서 가장 진보된 AI 모델을 기술 사양, 라이선스, 특장점과 함께 상세하게 검토한다. Mistral AI(프랑스) 등의 정보를 제공한다.

2025년 8월 15일 오전 4시 41분
2025년 최고의 Model Context Protocol (MCP) 뉴스 블로그 Top 6

Model Context Protocol이 AI 응용프로그램을위한 “USB-C 포트”로 진화함에 따라, 기업 통합, 개발 또는 연구를 위해 MCP를 활용하려는 모든 사람들에게 필수적인 권위있는 블로그 및 웹사이트들이 소개되었습니다.

2025년 8월 15일 오전 4시 18분
효율적인 AI 에이전트가 비싸지 않아도 된다는 증거

AI 에이전트가 대규모로 사용하기에 너무 비싸진 않았는가? OPPO AI 에이전트 팀의 연구 결과가 이 문제에 대한 실제 숫자와 해결책을 제시했다. 최신 AI 에이전트는 대규모 언어 처리 능력을 사용하여 거대하고 복잡한 작업을 수행할 수 있다.

2025년 8월 15일 오전 3시 34분
Dynamic Fine-Tuning (DFT): 지도된 미세 조정(SFT)의 일반화 간격을 줄이는 방법

지도된 미세 조정(SFT)은 LLMs를 새로운 작업에 적응시키는 표준 기술이지만, 종종 강화 학습(RL)에 비해 일반화에서 성능이 저하됩니다. DFT는 이 간극을 줄이는 새로운 방법을 제안합니다.

2025년 8월 15일 오전 3시 17분
메타 CLIP 2: 전 세계 이미지-텍스트 쌍으로부터 처음으로 훈련된 대조적 언어-이미지 사전 훈련 (CLIP)

CLIP는 현대 비전 및 멀티모달 모델에서 중요한 역할을 하고 있으며, 제로샷 이미지 분류와 MLLM의 비전 인코더로 활용되고 있다. 그러나 대부분의 CLIP 변형은 영어 데이터에만 국한되어 있어 전 세계 웹의 다양한 언어 콘텐츠를 무시한다. 메타 CLIP를 포함한 대부분의 CLIP 변형은 영어 데이터만을 다룬다.

2025년 8월 8일 오전 3시 38분
2025년 프록시 서버 설명: 유형, 사용 사례 및 트렌드 [기술 심층 분석]

2025년에는 디지털 프라이버시, 기업 보안 및 데이터 주도 자동화가 주요 이슈로 떠오르며, 프록시 서버는 개인 및 기관에게 필수적이다. 글로벌 웹 프록시 시장은 2025년까지 500억 달러에 이를 것으로 예상된다.

2025년 8월 8일 오전 3시 07분
CoAct-1 만나보기: GUI 기반 제어와 직접적인 프로그래밍 실행을 시너지적으로 결합한 혁신적인 멀티 에이전트 시스템

CoAct-1은 GUI 조작과 동등한 코딩을 통해 복잡한 컴퓨터 작업의 효율성과 신뢰성 문제를 극복하는 혁신적인 멀티 에이전트 컴퓨터 에이전트(CUA)로, USC, Salesforce AI 및 University of Washington의 연구진이 소개했다.

2025년 8월 7일 오후 9시 46분
NVIDIA XGBoost 3.0: Grace Hopper Superchip로 테라바이트 규모 데이터셋 학습

NVIDIA는 XGBoost 3.0을 발표했는데, 이제 1개의 GH200 Grace Hopper Superchip에서 기가바이트부터 1테라바이트(TB)까지의 그래디언트 부스팅 결정 트리 (GBDT) 모델을 학습할 수 있다. 이 혁신은 회사들이 사기 탐지, 신용 위험 모델링, 알고리즘 거래와 같은 애플리케이션을 위해 거대한 데이터셋을 처리할 수 있게 해준다.

2025년 8월 7일 오후 9시 22분
고급 LangGraph 멀티 에이전트 연구 파이프라인을 위한 코딩 구현

이 튜토리얼에서는 Google의 무료 Gemini 모델을 활용한 고급 LangGraph 멀티 에이전트 시스템을 구축하는 방법에 대해 설명합니다. 필요한 라이브러리 및 LangGraph, LangChain-Google-GenAI, LangChain-Core의 설치부터 구조화된 상태 정의, 연구 및 분석 도구 시뮬레이션, 세 가지 특수 에이전트(연구, 분석, 보고)의 연결까지 단계별로 안내합니다.

2025년 8월 7일 오후 4시 22분
OpenAI, GPT-5 발표: 최고의 오픈AI 모델

OpenAI가 GPT-5를 발표했는데, 일반적이고 특화된 작업에 적합한 GPT-5의 새로운 기능과 개선된 성능, 전략적 의미에 대해 설명하는 기사. GPT-5의 아키텍처, 기능, 성능 향상에 대한 기술적인 내용을 다룸.

2025년 8월 7일 오후 1시 53분
구글 AI가 DeepPolisher를 공개: 염기 수준 오류를 정확하게 교정하여 유전체 조립의 정확도를 향상시키는 새로운 딥러닝 도구

구글 AI가 UC Santa Cruz Genomics Institute와 협력하여 개발한 DeepPolisher는 염기 수준 오류를 정확하게 교정하여 유전체 조립의 정확도를 크게 향상시키는 새로운 딥러닝 도구이다. 최근 인간 판유전체 참조물을 발전시키는 데 효과적으로 활용되었다.

2025년 8월 7일 오후 1시 39분
알리바바, 그룹 시퀀스 정책 최적화(GSPO) 소개: Qwen3 모델을 촉진하는 효율적인 강화 학습 알고리즘

알리바바가 GSPO 알고리즘을 소개했다. 이 알고리즘은 Qwen3 모델을 촉진하는 효율적인 강화 학습 알고리즘이다. GSPO는 언어 모델의 확장에 결정적인 역할을 하며, 보다 심층적인 추론을 통해 경쟁 수준의 수학과 프로그래밍과 같은 복잡한 작업을 해결할 수 있도록 돕는다.

2025년 8월 7일 오후 1시 21분
MoE 아키텍처 비교: Qwen3 30B-A3B vs. GPT-OSS 20B

이 기사는 최근 출시된 두 Mixture-of-Experts (MoE) 트랜스포머 모델인 알리바바의 Qwen3 30B-A3B와 OpenAI의 GPT-OSS 20B를 기술적으로 비교한다. 두 모델은 MoE 아키텍처 설계에 대해 다른 접근을 취하며, 계산 효율성과 성능을 다양한 배포 시나리오에서 균형있게 유지한다.

2025년 8월 7일 오전 1시 02분
구글 딥마인드가 Genie 3을 소개합니다: 이전에는 없던 다양한 대화형 환경을 생성할 수 있는 일반용도의 세계 모델

구글 딥마인드가 Genie 3을 발표했습니다. 이 혁신적인 AI 시스템은 간단한 텍스트 프롬프트에서 대화형이고 물리적으로 일관된 가상 세계를 생성할 수 있습니다. 이는 세계 모델 분야에서 큰 도약을 의미하며, 환경을 이해하고 시뮬레이션하는 것뿐만 아니라 동적인 공간을 생성할 수 있습니다.

2025년 8월 7일 오전 12시 38분
Model Context Protocol (MCP) FAQs: 2025년에 알아야 할 모든 것

MCP는 대형 언어 모델 및 다른 AI 응용 프로그램을 필요로 하는 시스템 및 데이터와 연결하는 데 필수적인 표준이 되어왔다. 2025년에는 널리 채택되어 기업, 개발자 및 최종 사용자가 AI 기반 자동화, 지식 검색 및 실시간 의사 결정을 경험하는 방식을 혁신하고 있다.

2025년 8월 6일 오전 5시 55분
C3: 복잡한 구두 대화 모델링을 위한 이중 언어 벤치마크 데이터셋 및 평가 프레임워크 소개하는 AI 논문

본문에서는 중국에서 나온 새로운 연구 논문을 소개하며, 구두 대화 모델의 실제 대화 복잡성을 다루는 능력을 평가하는 것이 중요한 도전이라고 설명하고 있다.

2025년 8월 6일 오전 5시 15분
Google Gemini 및 SAGE 프레임워크를 활용한 스스로 적응형 목표 지향 AI 에이전트 구축 코딩 구현

이 튜토리얼에서는 Google의 Gemini API를 활용하여 SAGE 프레임워크(Self-Adaptive Goal-oriented Execution)에 기반한 고급 AI 에이전트 시스템을 구축하는 방법을 소개합니다. 자가평가, 적응형 계획, 목표 지향 실행, 경험 통합의 각 핵심 구성 요소를 살펴보며, 이를 결합하여 지능적이고 자체 개선이 가능한 에이전트를 만들어내는 방법을 다룹니다.

2025년 8월 6일 오전 4시 49분
OpenAI, 열풍을 일으키는 최신 오픈 가중치 LLMs 공개: gpt-oss-120B (고성능 노트북에서 실행) 및 gpt-oss-20B (휴대폰에서 실행)

OpenAI가 GPT-2 이후 처음으로 오픈 가중치 언어 모델 두 개를 공개했다. gpt-oss-120b와 gpt-oss-20b는 누구나 다운로드하고 검토하며 자신의 하드웨어에서 실행할 수 있는 모델이다. 이 런칭은 AI 세계를 바꾸는 중요한 사건으로 평가된다.

2025년 8월 5일 오후 7시 53분
Anthropic AI, LLMs의 개성 변화를 모니터링하고 제어하기 위해 Persona 벡터 소개

LLMs는 도움이 되고 무해하며 정직한 보조자 페르소나를 제공하는 대화형 인터페이스를 통해 배포된다. 그러나 LLMs는 훈련 및 배포 단계 전체에서 일관된 성격 특성을 유지하지 못한다. LLMs는 다양한 프롬프트 전략이나 문맥적 입력에 노출될 때 드라마틱하고 예측할 수 없는 페르소나 변화를 보인다. 훈련 과정은 의도하지 않은 성격 변화를 일으킬 수도 있다.

2025년 8월 5일 오후 6시 47분
Microsoft AutoGen 및 Gemini API를 활용한 다중 에이전트 대화형 AI 프레임워크 구축

이 튜토리얼에서는 Microsoft AutoGen을 Google의 무료 Gemini API와 통합하여 LiteLLM을 사용하여 Google Colab에서 원활하게 실행되는 강력한 다중 에이전트 대화형 AI 프레임워크를 구축하는 방법을 살펴봅니다. 환경 설정, AutoGen과 Gemini의 호환성 구성, 특화된 에이전트 팀 구축 과정을 안내합니다.

2025년 8월 5일 오전 2시 51분
구글 AI가 LangExtract를 공개: 비구조화 텍스트 문서에서 구조화된 데이터 추출하는 오픈 소스 파이썬 라이브러리

LangExtract는 구글 AI의 새로운 오픈 소스 파이썬 라이브러리로, 비구조화된 텍스트 문서에서 의미 있는 정보를 추출하는 것을 목표로 한다. 이 라이브러리는 Gemini와 같은 LLMs를 사용하여 이러한 과제를 직접 해결한다.

2025년 8월 5일 오전 1시 49분
NASA, 지구 관측과 원격 감지를 발전시키는 오픈 소스 멀티모달 모델 ‘갈릴레오’ 공개

NASA가 개발한 오픈 소스 멀티모달 모델 ‘갈릴레오’는 다양한 지구 관측 데이터를 처리, 분석, 이해하는 데 활용되며, 광학, 레이더, 해발, 기후, 보조지도 등을 대규모로 처리하는 데 사용된다. McGill 대학, NASA Harvest Ai2, Carleton 대학, British Columbia 대학, Vector Institute, Arizona 주립 대학 등의 연구진의 지원을 받아 개발되었다.

2025년 8월 4일 오후 6시 55분
앤써픽이 기업 AI 경쟁에서 오픈AI를 앞서가는 방법

앤써픽의 클로드가 기업 AI 시장에서 오픈AI를 앞선 것으로 나타났다. 앤써픽이 32%의 시장 점유율을 차지하며 오픈AI의 25%를 넘어섰다. 이는 오픈AI가 지난 해의 50%에서 급격히 하락한 것이다.

2025년 8월 4일 오전 4시 38분
2025년을 위한 실제 세계 AI 에이전트 구축을 위한 7가지 필수 레이어: 포괄적인 프레임워크

실제 세계에서 자율적으로 생각하고 배우고 행동할 수 있는 AI 시스템을 만들기 위해 필요한 7가지 핵심 레이어에 대한 포괄적인 프레임워크 소개.

2025년 8월 4일 오전 3시 14분
바이트댄스, Seed-Prover 소개: 자동 수학 정리 증명을 위한 고급 형식 추론 시스템

바이트댄스가 자연어 확장을 통해 수학적 추론을 향상시키는 LLMs를 소개했으며, 자연어 증명의 정확성 검증이 어려운 문제를 해결하기 위해 Seed-Prover를 도입했다.

2025년 8월 4일 오전 2시 51분
SHAP-IQ 시각화 탐색하는 튜토리얼

이 튜토리얼에서는 머신러닝 모델이 예측에 도달하는 방법에 대한 통찰을 제공하는 SHAP-IQ 시각화 범위를 탐색합니다. 이러한 시각화는 복잡한 모델 동작을 해석 가능한 구성 요소로 분해하여 각 특정 예측에 대한 기능의 개별 및 상호 작용적인 기여를 확인하는 데 도움을 줍니다.

2025년 8월 4일 오전 12시 45분
LLMs에서 컨텍스트 엔지니어링에 대한 기술 로드맵: 메커니즘, 벤치마크 및 오픈 챌린지

“대형 언어 모델을 구축, 최적화 및 관리하는 통합된 체계적 프레임워크인 컨텍스트 엔지니어링을 수립하는 연구. 주요 기여와 프레임워크에 대한 개요, 컨텍스트 엔지니어링의 의미, LLMs의 유용성과 도전 과제 등을 다룸.”

2025년 8월 3일 오후 5시 32분
AI/ML을 위한 CPU, GPU, NPU, TPU의 궁극적인 가이드: 성능, 사용 사례 및 주요 차이점

AI와 기계 학습 워크로드는 전통적인 CPU가 제공하는 것 이상의 계산 가속화를 촉진하여 특화된 하드웨어의 발전을 이끌었습니다. 각각의 처리 장치인 CPU, GPU, NPU, TPU는 AI 생태계에서 특정 모델, 응용 프로그램 또는 환경에 최적화되어 독특한 역할을 합니다. 이들의 주요 차이와 최상의 사용 사례에 대한 기술적이고 데이터 주도적인 분석을 제공합니다.

2025년 8월 3일 오전 6시 38분
Roboflow 감독을 활용한 엔드 투 엔드 객체 추적 및 분석 시스템 구축

Roboflow 감독 라이브러리를 활용하여 객체 감지 파이프라인을 구축하는 고급 튜토리얼. 실시간 객체 추적 설정, 감지 부드럽게 처리, 비디오 스트림에서 특정 지역을 모니터링하기 위해 다각형 영역 정의 등을 다룸. 프레임을 처리하면서 경계 상자, 객체 ID 등을 주석으로 달아줌.

2025년 8월 3일 오전 5시 22분