반말뉴스

2026년 5월 17일 일요일

20260517

GPT-5.5냐 클로드냐, 현직자들 사이에서 갈리는 최애 LLM 픽

커뮤니티

GPT-5.5냐 클로드냐, 현직자들 사이에서 갈리는 최애 LLM 픽

요즘 개발자들은 업무용으로 GPT-5.5의 일관성이랑 예측 가능성을 높게 평가하는 분위기야.
개인 프로젝트는 가성비랑 1M 토큰 윈도우 때문에 DeepSeek V4로 갈아타는 추세래.
결국 성능만큼이나 가격이랑 컨텍스트 크기가 실제 사용자를 움직이는 핵심 포인트야.

브라우저 속 마피아 게임, AI 에이전트 5명이 DuckDB 들고 판 짠다

도구

브라우저 속 마피아 게임, AI 에이전트 5명이 DuckDB 들고 판 짠다

브라우저 안에서 LLM 에이전트 5명이 마피아 게임을 하는 흥미로운 실험이 공개됐어.
특이하게 에이전트마다 전용 DuckDB를 줘서 개별적인 기억과 추론 데이터를 관리하게 해.
모델의 인메모리 처리 능력이랑 로컬 DB 활용도를 동시에 보여주는 영리한 사례야.

요즘 잘나가는 LLM 설계도 트렌드, KV 쉐어링부터 압축 어텐션까지

아키텍처

요즘 잘나가는 LLM 설계도 트렌드, KV 쉐어링부터 압축 어텐션까지

세바스찬 라슈카가 최근 LLM 아키텍처의 핵심 변화들을 아주 깔끔하게 정리해줬어.
MHC(Multi-Head Latent Attention)랑 KV 쉐어링 같은 기술이 효율성의 꿀팁이야.
모델 덩치는 커져도 연산은 가볍게 만들려는 엔지니어들의 집념이 고스란히 느껴져.

에이전트 군단 지휘? 아직 LLM은 매니저보다 실무자가 체질이야

트렌드

에이전트 군단 지휘? 아직 LLM은 매니저보다 실무자가 체질이야

여러 에이전트를 계층적으로 써봤는데, 메인 모델이 자꾸 지가 직접 일하려고 해서 문제야.
하위 에이전트한테 일을 맡겨도 결국 병합 단계에서 메인 모델이 다 망쳐놓는 게 현실이래.
아직은 모델들이 '관리자' 마인드가 부족해서 학습 단계부터 설계가 바뀌어야 할 수준이야.

알고리즘

LLM 추론 속도, 메가커널 최적화로 한계까지 쥐어짠 결과

DAG 기반 검색으로 메가커널을 적응형으로 최적화하는 Ada-MK 기법이 등장했어.
LLM 인퍼런스 효율을 극대화하려고 아키텍처 수준에서 고민한 흔적이 아주 낭낭해.
추론 비용 아끼고 싶은 개발자들에겐 꽤나 솔깃하고 실용적인 논문이 될 거야.

AI 에이전트 팀워크? 아직은 시기상조라는 현장의 매운맛 후기

트렌드

AI 에이전트 팀워크? 아직은 시기상조라는 현장의 매운맛 후기

여러 AI 에이전트한테 협업 시켜봤더니 서로 떠넘기거나 명령 무시하는 사태가 발생했대.
LLM들이 아직은 남한테 일 시키는 '매니저' 지능보다는 직접 뛰는 '실무자' 기질이 강한 듯.
멀티 에이전트 시스템이 제대로 돌아가려면 모델 학습 단계부터 협업 로직이 들어가야 할 판이야.

데이터 무제한 아니어도 괜찮아, 폰 안에서 돌아가는 똑똑한 서재

도구

데이터 무제한 아니어도 괜찮아, 폰 안에서 돌아가는 똑똑한 서재

안드로이드 앱 ClickBook이 llama.rn을 써서 오프라인 LLM 추론을 구현했어.
비행기 모드에서도 AI가 책 내용을 분석하고 요약해 주니까 보안이랑 편의성 다 잡았네.
클라우드 거치지 않고 내 폰 자원만으로 똑똑한 비서를 부리는 셈이라 꽤 쾌적해.

알고리즘

커널 최적화의 끝판왕 등장, LLM 추론 속도 날개 달았다

Ada-MK라는 새로운 기법이 나왔는데, 상황에 맞춰 메가커널을 최적화하는 게 핵심이야.
DAG 기반 검색으로 가장 효율적인 연산 경로를 찾아내니까 추론 성능이 확 올라가네.
복잡한 LLM 연산을 덩어리로 묶어서 효율적으로 처리하는 기술적 돌파구라고 봐도 무방해.

AI 전략 보고서의 허점, 이제 CLI로 싹 다 잡아낸다

도구

AI 전략 보고서의 허점, 이제 CLI로 싹 다 잡아낸다

LLM이 쓴 전략 보고서가 얼마나 위험한지 체크하는 전용 스키마랑 CLI 도구가 나왔어.
단순히 요약하는 수준을 넘어서 전략적 리스크를 정밀 감사(Audit)할 수 있게 설계됐네.
기업들이 AI 결과물을 무지성으로 믿지 않게 도와주는 든든한 감시관 역할을 할 듯해.

팀장 시켰더니 자기가 다 하네... LLM이 아직 '꼰대'인 이유

트렌드

팀장 시켰더니 자기가 다 하네... LLM이 아직 '꼰대'인 이유

여러 에이전트를 부리는 '팀장 LLM'이 대세인 줄 알았지? 현실은 아직 갈 길이 멀다는 뼈 때리는 후기야.
에이전트끼리 협업시키면 메인 LLM이 일을 안 넘기고 자기가 다 하려다가 결국 결과물을 망치는 경우가 많대.
지금 모델들은 뛰어난 개인 플레이어일 뿐, 누굴 관리하고 결과를 합치는 '매니징' 능력은 더 훈련이 필요한 듯해.

데이터 유출 걱정 끝! 내 폰에서 직접 돌아가는 독서 에이전트

도구

데이터 유출 걱정 끝! 내 폰에서 직접 돌아가는 독서 에이전트

안드로이드 유저라면 반가울 소식이야. 오프라인에서도 LLM을 돌릴 수 있는 eReader 앱 'ClickBook'이 떴어.
llama.rn 기술을 써서 폰 안에서 직접 추론하니까 인터넷 안 터지는 비행기 모드에서도 독서 도우미로 쓸 수 있지.
내 독서 데이터를 외부 서버로 보낼 필요가 없으니 보안에 민감한 똑똑이들이라면 안 좋아할 수가 없는 툴이야.

알고리즘

LLM 추론 속도 제로백 단축? 메가커널 최적화의 미친 존재감

LLM 추론 속도가 답답했다면 이 논문에 주목해봐. Ada-MK라는 새로운 적응형 최적화 기법이 나왔거든.
DAG(방향성 비순환 그래프) 기반 검색을 통해 상황에 딱 맞는 메가커널을 자동으로 찾아주는 신박한 방식이야.
알고리즘 레벨에서 추론 효율을 극대화하니까, AI 인프라 비용과 속도 고민하는 형들에겐 필독서가 될 것 같아.

LLM 전략 리스크, 아직도 감으로 해? CLI로 탈탈 털어보자

거버넌스

LLM 전략 리스크, 아직도 감으로 해? CLI로 탈탈 털어보자

LLM 도입할 때 발생할 수 있는 전략적 리스크를 체크해주는 Agenda Intel MD 스키마가 등장했어.
단순히 머릿속으로 고민하는 게 아니라, CLI 툴을 통해 구조적으로 오딧(Audit)을 할 수 있다는 게 핵심이야.
복잡한 LLM 전략 브리핑을 시스템적으로 검토하고 리스크를 관리하고 싶은 전문가들에게 딱인 오픈소스인 듯해.

OpenAI 그렉 브록만 전면 등판, 챗GPT와 코덱스 합쳐서 다 해먹을 기세

비즈니스

OpenAI 그렉 브록만 전면 등판, 챗GPT와 코덱스 합쳐서 다 해먹을 기세

OpenAI 공동 창업자 그렉 브록만이 제품 전략의 총책임자로 복귀했다는 소식이야.
핵심은 챗GPT랑 코딩 특화 모델인 Codex를 하나로 합치는 거대 프로젝트라고 해.
사용자 입장에서는 대화랑 코딩을 더 완벽하게 오가는 슈퍼 앱이 탄생할지도 모르는 상황이야.

AI 리스크 감사 귀찮지? 이 CLI 하나면 전략 분석 끝남

거버넌스

AI 리스크 감사 귀찮지? 이 CLI 하나면 전략 분석 끝남

LLM의 전략적 위험 요소를 감사할 수 있는 전용 스키마랑 CLI 도구가 공개됐어.
단순히 코드만 보는 게 아니라 AI 도입 시 발생할 수 있는 비즈니스 리스크를 체계적으로 훑어줘.
깃허브 오픈소스로 올라왔으니까 AI 거버넌스 고민하는 팀들은 당장 써보는 거 추천해.