중국산 저가 LLM 춘추전국시대! 넌 어떤 거 갖다 쓰고 있어?
중국산 저가 LLM 춘추전국시대! 넌 어떤 거 갖다 쓰고 있어?
- 최근 DeepSeek V4 Pro를 필두로 Mimo 2.5, MiniMax M3, GLM 5.2 등 중국발 초저가 모델이 엄청 쏟아지고 있어.
- 성능은 다들 비슷비슷해 보이는데 가격이 깡패 수준이라 실사용자들 사이에서 논쟁이 뜨거워.
- 실제 개발자들은 어떤 모델의 가성비와 한계점을 공유하고 있는지 스레드에서 직접 확인해봐.
브라우저에서 파이썬 돌리는 Pyodide 유저를 위한 WASM 휠 배포법
- 기술 블로거 Simon Willison이 PyPI에 WASM(WebAssembly) 바이너리를 배포하는 방법을 정리해 올렸어.
- 브라우저 환경(Pyodide)에서 무거운 파이썬 패키지를 서버 없이 네이티브에 준하는 속도로 돌릴 때 핵심이 되는 기술이야.
- 프론트엔드단에서 풍부한 파이썬 에코시스템을 그대로 녹여내고 싶은 개발자에게 꿀팁이 될 거야.
C/C++ 기반 로컬 추론의 지배자 Llama.cpp 공식 도메인 오픈
- 맥북이나 로컬 서버에서 가볍게 LLM을 돌릴 때 쓰는 Llama.cpp 프로젝트가 공식 웹사이트를 열었어.
- 가볍고 빠르게 CPU와 GPU 효율을 극대화해서 LLM을 구동하고 싶은 이들을 위한 최적의 가이드라인을 제공해.
- 오픈소스 빌드 방법이나 최신 릴리즈 정보를 빠르게 접하고 싶다면 방문해보자.
요즘 LLM 토큰 값 시세는 얼마? 한눈에 비교해주는 토큰 가격 인덱스 사이트
- LLM 제공사별 토큰 요금을 한곳에 모아 실시간 시세처럼 보여주는 'tokenpriceindex.com'이 등장했어.
- 매주 쏟아지는 신규 모델들과 단가 인하 경쟁 속에서 어떤 API가 가장 가성비 좋은지 한눈에 파악돼.
- 여러 LLM API를 조합해서 서비스 만드는 개발자라면 즐겨찾기 필수네.
영수증 찍으면 품목별로 더치페이 찢어주는 커플 필수 앱 BonSplit
- 독일에서 출시된 'BonSplit AI'는 단순히 총액만 쪼개는 게 아니라 품목별 가격과 카테고리까지 자동 인식해서 정산해줘.
- 매달 말에 서로 빚진 금액을 알아서 계산해주니까 생활비 정산할 때 껄끄러운 대화 나눌 필요가 없어.
- 닉네임과 내부 ID만 써서 개인정보 유출 걱정을 차단했고 데이터도 철저히 분리 보관하는 게 맘에 드네.
잠재 고객 발굴부터 메일 작성까지 혼자 다 해버리는 AI 영업 사원 'max'
- B2B 비즈니스의 프로스펙팅(잠재고객 발굴) 전 과정을 알아서 굴려주는 자율형 AI 에이전트 'yourmax.ai'가 등장했어.
- 타겟 목록 작성, 시그널 실시간 감지, 개인화된 콜드 메일 초안 작성까지 전부 알아서 처리해.
- 영업 팀을 아예 대체하는 게 아니라 협업하는 비서 느낌이라 퀄리티 컨트롤도 쉬울 듯해.
스케치 한 장 올리면 3D 모델링 없이 완성형 인테리어 렌더링 뽑아줌
- 인테리어와 건축 렌더링을 몇 초 만에 뽑아주는 AI 플랫폼 'archmaster'가 런칭했어.
- 방 사진이나 외경, 혹은 대충 그린 건축 스케치�� 업로드하고 스타일을 고르면 바로 실사 렌더링이 나와.
- 부분 수정(Inpainting)이나 렌더링을 짧은 비디오로 만드는 기능도 있어서 디자이너들 작업 속도 엄청 빨라지겠어.
AWS가 제안하는 'LLM 판사'의 근거 ��반 평가 프레임워크 GEDD
- AWS 샘플 프로젝트로 체계적인 증거 기반 LLM 평가 프레임워크인 'GEDD'가 올라왔어.
- LLM��� 평가 판사(Judge)로 쓸 때 단순 판단이 아니라 명확한 증거(Evidence)를 찾아서 평가하도록 설계됐대.
- 답변의 신뢰도를 객관적으로 검증하고 싶을 때 유용하게 쓸 수 있는 아키텍처 패턴이야.
Go 언어 개발자들 소리 질러! 실행 재플레이와 추적 기능 넣은 에이전트 프레임워크
- Go 언어 기반의 LLM 에이전트 프레임워크인 'Galdor'가 ���개되었어.
- 에이전트의 작동 과정을 상세히 추적(tracing)하고 실패한 시점부터 다시 재생(replay)하는 기능이 내��되어 있어.
- Go의 강점인 동시성을 활용해 안정적인 에이전트 서비스를 만들고 싶을 때 딱일 듯해.
로컬에서 LLM 추론 끝판왕 노리는 오픈소스 엔진 TensorSharp
- 깃허브에 로컬 LLM 추론 엔진인 'TensorSharp'가 오픈소스로 올라왔어.
- 아직 커뮤니티 극초기 단계이긴 한데 로컬 실행 성능에 관심 많다면 소스코드 뜯어보기 좋겠어.
- 로컬 인프라를 직접 구축하려는 개발자들에게 또 하나의 선택지가 생겼네.
Gemini 안전성의 진짜 비결은 RL이 아니라 SFT였다?
- 구글 딥마인드 팀이 Gemini 3.1 Pro와 Gemini 3 Flash로 실험해본 결과 의외의 사실을 발견했어.
- 대부분의 안전 관련 속성이 강화학습(RL)이 아닌 사전학습과 지도 미세조정(SFT)의 조합에서 나온대.
- 앞으로 모�� 안전성 개입을 위해 SFT 단계를 집중 공략하겠다고 하니 모델 튜닝할 때 참고해봐.
가족끼리 돈 얘기로 기분 상하기 싫을 때 쓰는 정산 비서
- BonSplit은 영수증 사진만 찍으면 항목별 가격과 세부 품목까지 싹 다 긁어내는 AI 앱이야.
- 총액 엔분의 일 정산이 아니라 '내가 먹은 메뉴'만 골라서 나눌 수 있어 쪼잔한 논쟁을 차단해줘.
- 독일에서 호스팅되어 닉네임을 쓰고 실명을 가려주니까 사생활 보안도 확실하게 챙겼어.
혼자서 영업 목록 따고 이메일까지 보내는 자동화 AI 영업 사원
- yourmax.ai의 영업 에이전트 max는 B2B 고객 발굴부터 아웃리치 작성까지 혼자서 굴러가.
- 고객 데이터를 찾고, 실시간 구매 신호를 감지해서 딱 알맞은 시점에 맞춤형 콜드 메일을 초안으로 짜줘.
- 사람 영업사원을 대체하는 게 아니라 옆에서 잡무를 줄여주니까 파이프라인 관리가 편해질 듯해.
글자만 툭 던지면 자막에 목소리까지 뚝딱 만드는 비디오 AI
- Vivideo는 텍스트나 이미지만 넣으면 순식간에 고품질 숏폼/마케팅 영상을 만드는 생성 툴이야.
- 다국어 AI 음성 더빙, 자동 캡션 생성은 물론이고 화면 전환까지 알아서 다 해줘.
- 수백만 개의 스톡 리소스를 활용해서 틱톡, 릴스, 유튜브 쇼츠 편집 지옥에서 탈출할 기회야.
똥손도 사진 한 장으로 프로 건축 디자이너 되는 법
- Archmaster는 방이나 외경 사진을 올리면 단 몇 초 만에 초현실적 3D 렌더링을 뽑아주는 서비스야.
- 스케치를 바로 실사 이미지로 바꾸거나, 마���에 안 드는 특정 영역만 쓱쓱 편집하는 인페인팅도 가능해.
- 어려운 툴 배울 필요 없이 인테리어 구상하는 집주인이나 디자이너들에게 유용할 듯하네.
내 에이전트들을 하나로 묶어 조종하는 사기템 등장했네
- 데이터브릭스가 Omnigent라는 에이전트 메타 하네스를 오픈소스로 공개���어.
- 여러 AI 에이전트를 결합하고 제어하고 공유할 수 있는 통합 플랫폼이야.
- 코딩부터 스케일링까지 지능형 에이전트들��� 하나로 제어해서 워크플로우를 극대화할 수 있어.
제미나이가 예의 바른 이유? 강화학습보다 SFT 덕분이라는 반전 사실
- 구글 딥마인드 연구팀이 제미나이의 안전성이 사실 강화학습(RL)보다 SFT(지도 미세 조정)에서 온다는 걸 발견했어.
- 사전학습과 SFT의 조합만으로도 대부분의 안전 특성이 결정된다는 건 기존 상식을 뒤집는 꽤 충격적인 결과야.
- 앞으로 모델의 도덕성과 안전성을 잡으려면 SFT 단계를 공략하는 게 가장 가성비 좋은 전략이 될 것 같아.
중구난방 AI 에이전트, 한데 모아 관리하는 '옴니전트'가 답이다
- 데이타브릭스가 여러 AI 에이전트를 하나로 묶어 결합하고 제어하는 메타 하네스 '옴니전트(Omnigent)'를 공개했어.
- 코딩부터 대규모 작업까지 파편화된 에이전트들을 효율적으로 공유하고 관리할 수 있게 된 게 핵심이야.
- 복잡한 AI 워크플로우를 한 손에 쥐고 흔들고 싶은 개발자들에겐 필살기 같은 도구가 될 듯해.