메뉴 바로가기 검색 및 카테고리 바로가기 본문 바로가기

LLM 서비스 설계와 최적화

비용은 낮추고 성능은 극대화하는 AI 서비스 구축과 운영 가이드

한빛미디어

번역서

판매중

  • 저자 : 슈레야스 수브라마니암
  • 번역 : 김현준 , 박은주
  • 출간 : 2025-04-10
  • 페이지 : 296 쪽
  • ISBN : 9791169213646
  • 물류코드 :11364
  • 초급 초중급 중급 중고급 고급
0점 (0명)
좋아요 : 0

생성형 AI의 경쟁력을 높이는 LLM 최적화 전략

 

AI와 머신러닝의 발전으로 거대 언어 모델(LLM)에 대한 관심은 급증했지만, 높은 비용 때문에 수많은 기업이 도입을 주저하고 있습니다. 이 책은 적은 비용으로 LLM을 구축하고 배포하는 효율적인 접근법을 소개합니다. 모델 선택, 프롬프트 엔지니어링, 파인튜닝, 배포의 각 단계에서 성능을 지나치게 희생하지 않으면서 비용을 최소화하는 방법을 만나 보세요.
검색 시스템이나 AI 에이전트와 같은 생성형 AI 애플리케이션 구현에 필요한 실용적이고 기술적인 지식을 제공합니다. 모델 양자화, 스케일링 등의 추론 최적화 기법과 인프라 비용 절감 방법을 탐구하여 생성형 AI 서비스의 경쟁력을 강화해 보세요.

 

슈레야스 수브라마니암 저자

슈레야스 수브라마니암

AWS의 수석 데이터 과학자입니다. 아마존 내부 팀과 대기업 고객을 대상으로 생성형 AI 애플리케이션의 대규모 구축, 튜닝 및 배포의 컨설팅을 맡고 있습니다. 기초 모델을 위한 고급 훈련, 튜닝 및 배포 기술의 최첨단 연구 개발을 담당하며, 머신러닝 중심의 비용 최적화 워크숍을 운영하여 클라우드에서 인공지능 애플리케이션의 비용을 절감하는 법을 컨설팅합니다.

김현준 역자

김현준

네이버에서 웨일 브라우저를 개발하는 엔지니어로 웹 기술에 큰 관심을 가지고 있습니다. 크로미움 오픈 소스에서 커미터로 활동했으며, 최근에는 AI 기술의 놀라운 발전 흐름을 따라 가기 위해 힘쓰고 있습니다. 특히 AI 안전에 큰 관심을 두고 머신 언러닝과 같은 기술을 탐구합니다.

박은주 역자

박은주

현재 딥러닝 분야에서 개인정보보호와 관련한 다양한 주제를 연구하고 있습니다. 챗GPT가 등장한 이후로 AI 연구의 새로운 변화가 일어남을 감지해 LLM에 대한 깊은 호기심을 품고 이 분야의 탐구를 시작하게 되었습니다.

CHAPTER 1 LLM 기초
_1.1 생성형 AI 애플리케이션과 LLM
_1.2 생성형 AI 애플리케이션의 상용화를 위한 길
_1.3 비용 최적화의 중요성
_1.4 요약

 

CHAPTER 2 비용 최적화를 위한 튜닝 기법
_2.1 파인튜닝 및 커스터마이징
_2.2 파라미터 효율적 파인튜닝(PEFT)
_2.3 PEFT의 비용 및 성능에 대한 영향
_2.4 요약

 

CHAPTER 3 비용 최적화를 위한 추론 테크닉
_3.1 추론 테크닉 소개
_3.2 프롬프트 엔지니어링
_3.3 벡터 스토어를 이용한 캐싱
_3.4 긴 문서를 관리하는 체인
_3.5 텍스트 요약
_3.6 효율적인 추론을 위한 배칭 프롬프트
_3.7 모델 최적화 방법
_3.8 파라미터 효율적 파인튜닝(PEFT)
_3.9 비용 및 성능 영향
_3.10 요약

 

CHAPTER 4 모델 선택과 대안
_4.1 모델 선택의 중요성
_4.2 효율적인 소형 모델
_4.3 성공적인 소형 모델 사례
_4.4 도메인 특화 모델
_4.5 범용 모델을 활용한 프롬프트의 성능
_4.6 요약

 

CHAPTER 5 인프라 및 배포 튜닝 전략
_5.1 튜닝 전략
_5.2 하드웨어 활용 및 배치 튜닝
_5.3 추론 가속화 도구
_5.4 모니터링과 옵저버빌리티
_5.5 요약

 

CHAPTER 6 성공적인 생성형 AI 도입의 열쇠
_6.1 성능과 비용의 균형
_6.2 생성형 AI 애플리케이션의 미래 트렌드
_6.3 요약

이제 AI 서비스의 핵심은 최적화!
LLM 서비스 설계의 모든 것을 배운다!


딥시크처럼 적은 투자로 높은 성능을 내는 LLM이 등장하며, AI 개발 과정에 최적화라는 키워드가 새로이 떠올랐습니다. 이 책은 소형 모델(SLM) 활용법, 효과적인 프롬프트 엔지니어링, 파인튜닝, 양자화 기법까지, 기업과 개발자들이 효율적인 투자로 고성능의 AI 서비스를 구축하는 데 필요한 모든 방법론과 이론을 다룹니다. 다양한 이론과 사례 연구로 효과적인 인사이트를 얻어 보세요. AI 기술 도입 비용으로 고민하는 국내 스타트업과 기업, 개발자라면 반드시 참고해야 할 지침서입니다.
 

주요 내용

  • LLM의 높은 계산 비용 문제를 해결하는 효과적인 기법
  • 비용 효율적인 생성 AI 서비스를 만드는 파인튜닝과 추론, 양자화 기법
  • 소형 모델, 도메인 특화 모델 등 대안 모델
     

대상 독자

  • 효율적인 AI 모델을 구축, 튜닝, 배포하고 싶은 실무 엔지니어
  • AI 서비스에 대한 비즈니스적인 평가를 내리려는 기획자 및 결정권자
  • LLM을 비롯한 인공지능 모델의 전반적인 기술을 알고 싶은 개발자
  • 생성형 AI 및 LLM을 연구하는 학생 및 교수

  • 첫번째 리뷰어가 되어주세요.
  • 결제하기
    • 문화비 소득공제 가능
    • 배송료 : 2,000원배송료란?

    배송료 안내

    • 20,000원 이상 구매시 도서 배송 무료
    • 브론즈, 실버, 골드회원 무료배송
    닫기

    예약판매 안내

    온라인 주문시 "2025-04-10 출고" 예상(출고 후 1~2일 이내 수령) - 내부 사정으로 출시가 지연될 수 있습니다.

    구매한 도서중 예약도서가 포함되어 있을 경우, 예약도서 출고일에 함께 배송됩니다.

    리뷰쓰기

    닫기
    * 상품명 :
    LLM 서비스 설계와 최적화
    * 제목 :
    * 별점평가
    * 내용 :

    * 리뷰 작성시 유의사항

    글이나 이미지/사진 저작권 등 다른 사람의 권리를 침해하거나 명예를 훼손하는 게시물은 이용약관 및 관련법률에 의해 제재를 받을 수 있습니다.

    1. 특히 뉴스/언론사 기사를 전문 또는 부분적으로 '허락없이' 갖고 와서는 안됩니다 (출처를 밝히는 경우에도 안됨).
    2. 저작권자의 허락을 받지 않은 콘텐츠의 무단 사용은 저작권자의 권리를 침해하는 행위로, 이에 대한 법적 책임을 지게 될 수 있습니다.

    오탈자 등록

    닫기
    * 도서명 :
    LLM 서비스 설계와 최적화
    * 구분 :
    * 상품 버전
    종이책 PDF ePub
    * 페이지 :
    * 위치정보 :
    * 내용 :

    도서 인증

    닫기
    도서명*
    LLM 서비스 설계와 최적화
    구입처*
    구입일*
    부가기호*
    부가기호 안내

    * 온라인 또는 오프라인 서점에서 구입한 도서를 인증하면 마일리지 500점을 드립니다.

    * 도서인증은 일 3권, 월 10권, 년 50권으로 제한되며 절판도서, eBook 등 일부 도서는 인증이 제한됩니다.

    * 구입하지 않고, 허위로 도서 인증을 한 것으로 판단되면 웹사이트 이용이 제한될 수 있습니다.

    닫기

    해당 상품을 장바구니에 담았습니다.이미 장바구니에 추가된 상품입니다.
    장바구니로 이동하시겠습니까?