중국산 저가 LLM 춘추전국시대! 넌 어떤 거 갖다 쓰고 있어?

20260614

중국산 저가 LLM 춘추전국시대! 넌 어떤 거 갖다 쓰고 있어?
커뮤니티

중국산 저가 LLM 춘추전국시대! 넌 어떤 거 갖다 쓰고 있어?

  • 최근 DeepSeek V4 Pro를 필두로 Mimo 2.5, MiniMax M3, GLM 5.2 등 중국발 초저가 모델이 엄청 쏟아지고 있어.
  • 성능은 다들 비슷비슷해 보이는데 가격이 깡패 수준이라 실사용자들 사이에서 논쟁이 뜨거워.
  • 실제 개발자들은 어떤 모델의 가성비와 한계점을 공유하고 있는지 스레드에서 직접 확인해봐.
브라우저에서 파이썬 돌리는 Pyodide 유저를 위한 WASM 휠 배포법
데이터

브라우저에서 파이썬 돌리는 Pyodide 유저를 위한 WASM 휠 배포법

  • 기술 블로거 Simon Willison이 PyPI에 WASM(WebAssembly) 바이너리를 배포하는 방법을 정리해 올렸어.
  • 브라우저 환경(Pyodide)에서 무거운 파이썬 패키지를 서버 없이 네이티브에 준하는 속도로 돌릴 때 핵심이 되는 기술이야.
  • 프론트엔드단에서 풍부한 파이썬 에코시스템을 그대로 녹여내고 싶은 개발자에게 꿀팁이 될 거야.
C/C++ 기반 로컬 추론의 지배자 Llama.cpp 공식 도메인 오픈
인프라

C/C++ 기반 로컬 추론의 지배자 Llama.cpp 공식 도메인 오픈

  • 맥북이나 로컬 서버에서 가볍게 LLM을 돌릴 때 쓰는 Llama.cpp 프로젝트가 공식 웹사이트를 열었어.
  • 가볍고 빠르게 CPU와 GPU 효율을 극대화해서 LLM을 구동하고 싶은 이들을 위한 최적의 가이드라인을 제공해.
  • 오픈소스 빌드 방법이나 최신 릴리즈 정보를 빠르게 접하고 싶다면 방문해보자.
요즘 LLM 토큰 값 시세는 얼마? 한눈에 비교해주는 토큰 가격 인덱스 사이트
트렌드

요즘 LLM 토큰 값 시세는 얼마? 한눈에 비교해주는 토큰 가격 인덱스 사이트

  • LLM 제공사별 토큰 요금을 한곳에 모아 실시간 시세처럼 보여주는 'tokenpriceindex.com'이 등장했어.
  • 매주 쏟아지는 신규 모델들과 단가 인하 경쟁 속에서 어떤 API가 가장 가성비 좋은지 한눈에 파악돼.
  • 여러 LLM API를 조합해서 서비스 만드는 개발자라면 즐겨찾기 필수네.
영수증 찍으면 품목별로 더치페이 찢어주는 커플 필수 앱 BonSplit
비즈니스

영수증 찍으면 품목별로 더치페이 찢어주는 커플 필수 앱 BonSplit

  • 독일에서 출시된 'BonSplit AI'는 단순히 총액만 쪼개는 게 아니라 품목별 가격과 카테고리까지 자동 인식해서 정산해줘.
  • 매달 말에 서로 빚진 금액을 알아서 계산해주니까 생활비 정산할 때 껄끄러운 대화 나눌 필요가 없어.
  • 닉네임과 내부 ID만 써서 개인정보 유출 걱정을 차단했고 데이터도 철저히 분리 보관하는 게 맘에 드네.
잠재 고객 발굴부터 메일 작성까지 혼자 다 해버리는 AI 영업 사원 'max'
비즈니스

잠재 고객 발굴부터 메일 작성까지 혼자 다 해버리는 AI 영업 사원 'max'

  • B2B 비즈니스의 프로스펙팅(잠재고객 발굴) 전 과정을 알아서 굴려주는 자율형 AI 에이전트 'yourmax.ai'가 등장했어.
  • 타겟 목록 작성, 시그널 실시간 감지, 개인화된 콜드 메일 초안 작성까지 전부 알아서 처리해.
  • 영업 팀을 아예 대체하는 게 아니라 협업하는 비서 느낌이라 퀄리티 컨트롤도 쉬울 듯해.
스케치 한 장 올리면 3D 모델링 없이 완성형 인테리어 렌더링 뽑아줌
생산성

스케치 한 장 올리면 3D 모델링 없이 완성형 인테리어 렌더링 뽑아줌

  • 인테리어와 건축 렌더링을 몇 초 만에 뽑아주는 AI 플랫폼 'archmaster'가 런칭했어.
  • 방 사진이나 외경, 혹은 대충 그린 건축 스케치�� 업로드하고 스타일을 고르면 바로 실사 렌더링이 나와.
  • 부분 수정(Inpainting)이나 렌더링을 짧은 비디오로 만드는 기능도 있어서 디자이너들 작업 속도 엄청 빨라지겠어.
AWS가 제안하는 'LLM 판사'의 근거 ��반 평가 프레임워크 GEDD
아키텍처

AWS가 제안하는 'LLM 판사'의 근거 ��반 평가 프레임워크 GEDD

  • AWS 샘플 프로젝트로 체계적인 증거 기반 LLM 평가 프레임워크인 'GEDD'가 올라왔어.
  • LLM��� 평가 판사(Judge)로 쓸 때 단순 판단이 아니라 명확한 증거(Evidence)를 찾아서 평가하도록 설계됐대.
  • 답변의 신뢰도를 객관적으로 검증하고 싶을 때 유용하게 쓸 수 있는 아키텍처 패턴이야.
Go 언어 개발자들 소리 질러! 실행 재플레이와 추적 기능 넣은 에이전트 프레임워크
도구

Go 언어 개발자들 소리 질러! 실행 재플레이와 추적 기능 넣은 에이전트 프레임워크

  • Go 언어 기반의 LLM 에이전트 프레임워크인 'Galdor'가 ���개되었어.
  • 에이전트의 작동 과정을 상세히 추적(tracing)하고 실패한 시점부터 다시 재생(replay)하는 기능이 내��되어 있어.
  • Go의 강점인 동시성을 활용해 안정적인 에이전트 서비스를 만들고 싶을 때 딱일 듯해.
로컬에서 LLM 추론 끝판왕 노리는 오픈소스 엔진 TensorSharp
라이브러리

로컬에서 LLM 추론 끝판왕 노리는 오픈소스 엔진 TensorSharp

  • 깃허브에 로컬 LLM 추론 엔진인 'TensorSharp'가 오픈소스로 올라왔어.
  • 아직 커뮤니티 극초기 단계이긴 한데 로컬 실행 성능에 관심 많다면 소스코드 뜯어보기 좋겠어.
  • 로컬 인프라를 직접 구축하려는 개발자들에게 또 하나의 선택지가 생겼네.
Gemini 안전성의 진짜 비결은 RL이 아니라 SFT였다?
모델

Gemini 안전성의 진짜 비결은 RL이 아니라 SFT였다?

  • 구글 딥마인드 팀이 Gemini 3.1 Pro와 Gemini 3 Flash로 실험해본 결과 의외의 사실을 발견했어.
  • 대부분의 안전 관련 속성이 강화학습(RL)이 아닌 사전학습과 지도 미세조정(SFT)의 조합에서 나온대.
  • 앞으로 모�� 안전성 개입을 위해 SFT 단계를 집중 공략하겠다고 하니 모델 튜닝할 때 참고해봐.
가족끼리 돈 얘기로 기분 상하기 싫을 때 쓰는 정산 비서
도구

가족끼리 돈 얘기로 기분 상하기 싫을 때 쓰는 정산 비서

  • BonSplit은 영수증 사진만 찍으면 항목별 가격과 세부 품목까지 싹 다 긁어내는 AI 앱이야.
  • 총액 엔분의 일 정산이 아니라 '내가 먹은 메뉴'만 골라서 나눌 수 있어 쪼잔한 논쟁을 차단해줘.
  • 독일에서 호스팅되어 닉네임을 쓰고 실명을 가려주니까 사생활 보안도 확실하게 챙겼어.
혼자서 영업 목록 따고 이메일까지 보내는 자동화 AI 영업 사원
비즈니스

혼자서 영업 목록 따고 이메일까지 보내는 자동화 AI 영업 사원

  • yourmax.ai의 영업 에이전트 max는 B2B 고객 발굴부터 아웃리치 작성까지 혼자서 굴러가.
  • 고객 데이터를 찾고, 실시간 구매 신호를 감지해서 딱 알맞은 시점에 맞춤형 콜드 메일을 초안으로 짜줘.
  • 사람 영업사원을 대체하는 게 아니라 옆에서 잡무를 줄여주니까 파이프라인 관리가 편해질 듯해.
글자만 툭 던지면 자막에 목소리까지 뚝딱 만드는 비디오 AI
생산성

글자만 툭 던지면 자막에 목소리까지 뚝딱 만드는 비디오 AI

  • Vivideo는 텍스트나 이미지만 넣으면 순식간에 고품질 숏폼/마케팅 영상을 만드는 생성 툴이야.
  • 다국어 AI 음성 더빙, 자동 캡션 생성은 물론이고 화면 전환까지 알아서 다 해줘.
  • 수백만 개의 스톡 리소스를 활용해서 틱톡, 릴스, 유튜브 쇼츠 편집 지옥에서 탈출할 기회야.
똥손도 사진 한 장으로 프로 건축 디자이너 되는 법
생산성

똥손도 사진 한 장으로 프로 건축 디자이너 되는 법

  • Archmaster는 방이나 외경 사진을 올리면 단 몇 초 만에 초현실적 3D 렌더링을 뽑아주는 서비스야.
  • 스케치를 바로 실사 이미지로 바꾸거나, 마���에 안 드는 특정 영역만 쓱쓱 편집하는 인페인팅도 가능해.
  • 어려운 툴 배울 필요 없이 인테리어 구상하는 집주인이나 디자이너들에게 유용할 듯하네.
내 에이전트들을 하나로 묶어 조종하는 사기템 등장했네
도구

내 에이전트들을 하나로 묶어 조종하는 사기템 등장했네

  • 데이터브릭스가 Omnigent라는 에이전트 메타 하네스를 오픈소스로 공개���어.
  • 여러 AI 에이전트를 결합하고 제어하고 공유할 수 있는 통합 플랫폼이야.
  • 코딩부터 스케일링까지 지능형 에이전트들��� 하나로 제어해서 워크플로우를 극대화할 수 있어.
제미나이가 예의 바른 이유? 강화학습보다 SFT 덕분이라는 반전 사실
모델

제미나이가 예의 바른 이유? 강화학습보다 SFT 덕분이라는 반전 사실

  • 구글 딥마인드 연구팀이 제미나이의 안전성이 사실 강화학습(RL)보다 SFT(지도 미세 조정)에서 온다는 걸 발견했어.
  • 사전학습과 SFT의 조합만으로도 대부분의 안전 특성이 결정된다는 건 기존 상식을 뒤집는 꽤 충격적인 결과야.
  • 앞으로 모델의 도덕성과 안전성을 잡으려면 SFT 단계를 공략하는 게 가장 가성비 좋은 전략이 될 것 같아.
중구난방 AI 에이전트, 한데 모아 관리하는 '옴니전트'가 답이다
도구

중구난방 AI 에이전트, 한데 모아 관리하는 '옴니전트'가 답이다

  • 데이타브릭스가 여러 AI 에이전트를 하나로 묶어 결합하고 제어하는 메타 하네스 '옴니전트(Omnigent)'를 공개했어.
  • 코딩부터 대규모 작업까지 파편화된 에이전트들을 효율적으로 공유하고 관리할 수 있게 된 게 핵심이야.
  • 복잡한 AI 워크플로우를 한 손에 쥐고 흔들고 싶은 개발자들에겐 필살기 같은 도구가 될 듯해.