본문 바로가기

NPU

(7)
엔비디아, 게이밍 GPU 전략 변화 엔비디아가 2026년 신규 게이밍 GPU(GeForce/RTX) 출시를 하지 않거나 연기하는 방안을 검토 중이다. 이는 메모리(HBM) 공급 부족이 주된 원인으로 지목된다. (글로벌경제뉴스)업계 보고에 따르면 2026년 RTX 50 시리즈의 신제품(예: RTX 5080 Super 등) 출시/양산이 우선순위에서 밀려나거나 연기되고 있다. (Tom's Hardware)메모리 반도체, 특히 HBM(고대역폭 메모리) 공급 부족이 심각해 AI 데이터센터용 GPU에 메모리가 우선 할당되는 전략이 시행되고 있다. (글로벌경제뉴스)이로 인해 엔비디아는 게이밍 GPU 부문을 당분간 후순위로 두고 AI 가속기/데이터센터 GPU에 자원 집중하는 방향으로 사업 전략을 조정하는 것으로 알려졌다. (Nate News)이는 약 3..
KAIST, 엔비디아보다 2.1배 빠른 AI 반도체 기술 개발 기술명 ‘오토GNN(AutoGNN)’ : 그래프 신경망(GNN) 추론에 특화된 AI 반도체 기술 개발. (미래를 보는 창 - 전자신문)개발 주체 : KAIST 전기및전자공학부 정명수 교수 연구팀. (미래를 보는 창 - 전자신문)주요 성능 : 엔비디아 고성능 GPU(NVIDIA RTX3090 기준) 대비 추론 속도 최대 2.1배 빠름. (지디넷코리아)전력 효율 : 동일 작업 대비 전력 소비는 크게 감소3.3배 이상 효율적이라는 평가도 있음. (지디넷코리아)핵심 해결 과제 : 전통 GPU는 그래프 데이터 전처리 연산에서 병목이 발생KAIST 기술은 이 병목 구간을 반도체 내부 구조로 최적화하여 제거함. (다음)전처리 최적화 : 추론 이전의 그래프 전처리가 전체 처리 시간의 70~90%를 차지한다는 점을 연구..
학습(Training)의 시대에서 추론(Inference)의 시대로, 연산보다 데이터 공급 병목 생성형 AI가 학습(Training) 중심에서 추론(Inference) 중심으로 이동하면서, 연산보다 데이터 공급(메모리 대역폭·용량)이 병목이 되어 HBM, 서버 DRAM, NAND까지 동반 호황이 전개될 수 있다는 전망이 확산. (한국경제)국내 보도는 2026년 메모리 반도체 시장이 약 4,400억 달러 규모로 커지며, 시장 전망이 크게 상향(IB 전망 30% 상향 언급)됐다는 프레임으로 “내년 시장 두 배”를 제시. (한국경제)해석 포인트 : “두 배”는 해당 기사에서 설정한 기준(전년 대비·집계 범위)을 전제로 한 표현이며, 리서치 기관별 범주(HBM 포함/제외 등)에 따라 수치 차이가 날 수 있음. (한국경제) 왜 ‘추론 시대’가 메모리 전성기를 만들나(기술/서비스 구조)LLM 추론은 KV 캐시..
국산 NPU로 피지컬 AI를 돌린다, K-엔비디아 프로젝트 정부가 국산 AI반도체(NPU 등) 생태계를 ‘엔비디아급’으로 키우기 위해 투자, 실증, SW플랫폼, 공공수요까지 묶어 추진하는 AI반도체 도약 패키지(정책·펀드·실증 연계)를 발표했다. (서울경제)학습용 GPU 시장(엔비디아 중심)뿐 아니라, 앞으로 커질 저전력, 고효율 ‘추론’ 및 ‘피지컬 AI(로봇, 제조, 국방 등 물리세계 적용)’ 영역을 선점하겠다는 방향을 명시했다. (현대경제)즉, “GPU 대체”가 아니라 피지컬 AI/추론에 강한 국산 NPU 경쟁력 확보를 정책 전면에 둔 것으로 해석 할수있다. (다음) 정책 패키지 주요내용 A. K-NPU 프로젝트(성능·SW 풀스택·실증)SW 풀스택 기반 성능 고도화 및 한국형 CUDA(쿠다) 플랫폼 개발을 추진하는 내용이 보도됨. (서울경제)2027년까지 ..
2025 인공지능반도체 미래기술 컨퍼런스 리뷰 2025 인공지능반도체 미래기술 컨퍼런스는 국산 AI 반도체 성능평가기준 ‘K-Perf’ 공개 및 협의체 출범과 함께 R&D 성과, 산업 협력 확대 및 정부의 AI 반도체 전략을 논의하는 자리였다. (First-Class 경제신문 파이낸셜뉴스) 국산 AI 반도체 성능 기준 K-Perf 발표산업계, 정부가 공동으로 마련한 국산 신경망처리장치(NPU) 성능지표 ‘K-Perf’를 소개·공개함. (First-Class 경제신문 파이낸셜뉴스)K-Perf는 수요기업이 요구하는 다양한 서비스 환경 기준을 반영해 NPU 성능 측정 모델, 조건, 지표를 세분화한 것이 특징. (대한민국 정책브리핑)이를 통해 실제 사용 환경 중심의 성능 데이터 표준화, 공유 체계 기반 마련 기대. (First-Class 경제신문 파이낸셜뉴..
리벨리온, 국산 NPU를 기반으로 풀스택 K-AI 완성하겠다... 리벨리온은 SKT 컨소시엄과 함께 국산 NPU를 기반으로 ‘풀스택 K-AI’를 완성하겠다고 발표했다. (뉴스프라임) 풀스택 K-AI 는 반도체(NPU), 인프라, 파운데이션 모델, 서비스까지 전 층위를 국산 기술로 구현하겠다는 개념 이다. (SK텔레콤 뉴스룸)해외 GPU·클라우드 의존도를 줄이고, 한국형 AI 기술 주권(소버린 AI)을 확보하는 것이 목표라고 밝혔다. (유니콘팩토리) 리벨리온 NPU 적용 현황SKT는 리벨리온 ATOM NPU 탑재 서버를 자체 핵심 서비스에 테스트 중테스트 결과에 따라, 대규모 추론용 ‘ATOM-Max’의 상용 적용 및 NPU 서버 도입 확대 계획. (Rebellions)/ 국산 NPU의 기술, 사업적 의미 리벨리온 ATOM은 이전 벤치마크에서 일부 언어·비전 추론에서 ..
퓨리오사AI, 2026년 본격 NPU양산 시작., GPU 대체 가능성은.... 퓨리오사AI는 2세대 NPU인 레니게이드(RNGD)를 2026년 1월부터 양산한다고 공식 발표했습니다. 한국경제+2한국경제+2레니게이드는 AI 모델 “추론(Inference)” 용도에 특화된 가속기로, 글로벌 데이터센터와 클라우드 서비스 시장을 타깃으로 삼고 있습니다. 한국경제+2더벨+2가격 정책도 경쟁적입니다. 권장가격 기준으로 약 1만 달러(한화 약 1,300-1,400만 원) 수준으로 설정되어, 경쟁 제품 대비 경쟁력을 확보하려는 모습입니다. 미래를 보는 창 - 전자신문+2동아일보+2 양산 시점 : 2026년 1월부터 TSMC 5nm 공정에서 2세대 NPU ‘레니게이드(RNGD)’ 양산 시작.한국경제 타깃 시장 : GPU처럼 학습용이 아니라, 추론(Inference) 특화 칩으로 데이터센터, 엣지(..