link 세부 정보
정보 바로가기 : 엔비디아 '라마4' 추론 가속 기술 공개…한국형 AI도 개발 박차
엔비디아 '라마4' 추론 가속 기술 공개…한국형 AI도 개발 박차[카테고리 설정이 아직되어 있지 않습니다.]
라마4 시리즈는 메타가 처음으로 전문가혼합(Mixture of Experts·MoE) 아키텍처를 적용한 최신 모델이다. 엔비디아는 두 모델을 'TensorRT-LLM'에 최적화하고 블랙웰 FP4 텐서코어 성능을 더해 초당 토큰 처리 속도를...