메뉴 바로가기 검색 및 카테고리 바로가기 본문 바로가기

LLM 서비스 설계와 최적화

비용은 낮추고 성능은 극대화하는 AI 서비스 구축과 운영 가이드

한빛미디어

번역서

판매중

  • 저자 : 슈레야스 수브라마니암
  • 번역 : 김현준 , 박은주
  • 출간 : 2025-04-10
  • 페이지 : 296 쪽
  • ISBN : 9791169213646
  • eISBN : 9791169219297
  • 물류코드 :11364
  • 초급 초중급 중급 중고급 고급
5점 (1명)
좋아요 : 4

생성형 AI의 경쟁력을 높이는 LLM 최적화 전략

 

AI와 머신러닝의 발전으로 거대 언어 모델(LLM)에 대한 관심은 급증했지만, 높은 비용 때문에 수많은 기업이 도입을 주저하고 있습니다. 이 책은 적은 비용으로 LLM을 구축하고 배포하는 효율적인 접근법을 소개합니다. 모델 선택, 프롬프트 엔지니어링, 파인튜닝, 배포의 각 단계에서 성능을 지나치게 희생하지 않으면서 비용을 최소화하는 방법을 만나 보세요.
검색 시스템이나 AI 에이전트와 같은 생성형 AI 애플리케이션 구현에 필요한 실용적이고 기술적인 지식을 제공합니다. 모델 양자화, 스케일링 등의 추론 최적화 기법과 인프라 비용 절감 방법을 탐구하여 생성형 AI 서비스의 경쟁력을 강화해 보세요.

 

슈레야스 수브라마니암 저자

슈레야스 수브라마니암

AWS의 수석 데이터 과학자입니다. 아마존 내부 팀과 대기업 고객을 대상으로 생성형 AI 애플리케이션의 대규모 구축, 튜닝 및 배포의 컨설팅을 맡고 있습니다. 기초 모델을 위한 고급 훈련, 튜닝 및 배포 기술의 최첨단 연구 개발을 담당하며, 머신러닝 중심의 비용 최적화 워크숍을 운영하여 클라우드에서 인공지능 애플리케이션의 비용을 절감하는 법을 컨설팅합니다.

김현준 역자

김현준

네이버에서 웨일 브라우저를 개발하는 엔지니어로 웹 기술에 큰 관심을 가지고 있습니다. 크로미움 오픈 소스에서 커미터로 활동했으며, 최근에는 AI 기술의 놀라운 발전 흐름을 따라 가기 위해 힘쓰고 있습니다. 특히 AI 안전에 큰 관심을 두고 머신 언러닝과 같은 기술을 탐구합니다.

박은주 역자

박은주

현재 딥러닝 분야에서 개인정보보호와 관련한 다양한 주제를 연구하고 있습니다. 챗GPT가 등장한 이후로 AI 연구의 새로운 변화가 일어남을 감지해 LLM에 대한 깊은 호기심을 품고 이 분야의 탐구를 시작하게 되었습니다.

CHAPTER 1 LLM 기초
_1.1 생성형 AI 애플리케이션과 LLM
_1.2 생성형 AI 애플리케이션의 상용화를 위한 길
_1.3 비용 최적화의 중요성
_1.4 요약

 

CHAPTER 2 비용 최적화를 위한 튜닝 기법
_2.1 파인튜닝 및 커스터마이징
_2.2 파라미터 효율적 파인튜닝(PEFT)
_2.3 PEFT의 비용 및 성능에 대한 영향
_2.4 요약

 

CHAPTER 3 비용 최적화를 위한 추론 테크닉
_3.1 추론 테크닉 소개
_3.2 프롬프트 엔지니어링
_3.3 벡터 스토어를 이용한 캐싱
_3.4 긴 문서를 관리하는 체인
_3.5 텍스트 요약
_3.6 효율적인 추론을 위한 배칭 프롬프트
_3.7 모델 최적화 방법
_3.8 파라미터 효율적 파인튜닝(PEFT)
_3.9 비용 및 성능 영향
_3.10 요약

 

CHAPTER 4 모델 선택과 대안
_4.1 모델 선택의 중요성
_4.2 효율적인 소형 모델
_4.3 성공적인 소형 모델 사례
_4.4 도메인 특화 모델
_4.5 범용 모델을 활용한 프롬프트의 성능
_4.6 요약

 

CHAPTER 5 인프라 및 배포 튜닝 전략
_5.1 튜닝 전략
_5.2 하드웨어 활용 및 배치 튜닝
_5.3 추론 가속화 도구
_5.4 모니터링과 옵저버빌리티
_5.5 요약

 

CHAPTER 6 성공적인 생성형 AI 도입의 열쇠
_6.1 성능과 비용의 균형
_6.2 생성형 AI 애플리케이션의 미래 트렌드
_6.3 요약

이제 AI 서비스의 핵심은 최적화!
LLM 서비스 설계의 모든 것을 배운다!


딥시크처럼 적은 투자로 높은 성능을 내는 LLM이 등장하며, AI 개발 과정에 최적화라는 키워드가 새로이 떠올랐습니다. 이 책은 소형 모델(SLM) 활용법, 효과적인 프롬프트 엔지니어링, 파인튜닝, 양자화 기법까지, 기업과 개발자들이 효율적인 투자로 고성능의 AI 서비스를 구축하는 데 필요한 모든 방법론과 이론을 다룹니다. 다양한 이론과 사례 연구로 효과적인 인사이트를 얻어 보세요. AI 기술 도입 비용으로 고민하는 국내 스타트업과 기업, 개발자라면 반드시 참고해야 할 지침서입니다.
 

주요 내용

  • LLM의 높은 계산 비용 문제를 해결하는 효과적인 기법
  • 비용 효율적인 생성 AI 서비스를 만드는 파인튜닝과 추론, 양자화 기법
  • 소형 모델, 도메인 특화 모델 등 대안 모델
     

대상 독자

  • 효율적인 AI 모델을 구축, 튜닝, 배포하고 싶은 실무 엔지니어
  • AI 서비스에 대한 비즈니스적인 평가를 내리려는 기획자 및 결정권자
  • LLM을 비롯한 인공지능 모델의 전반적인 기술을 알고 싶은 개발자
  • 생성형 AI 및 LLM을 연구하는 학생 및 교수

한빛미디어 서평단 <나는 리뷰어다> 활동을 위해서 책을 협찬 받아 작성된 서평입니다.

 

 LLM 서비스 설계와 최적화 - 저자: 슈레야스 수브라마니암
 번역 : 김현준, 박은주 

 

생성형 AI와 LLM은 복잡한 작업을 수행하기 때문에 상당한 컴퓨팅 자원이 필요하다. 방대한 컴퓨팅 자원 수요를 해결하기 위해 기술을 도입하는 비용은 조직에게 부담이 된다. 실제로 책에서 말하는 바에 따르면 최첨단 AI 모델 훈련비용이 2016년 이후 매년 2.4배씩 증가하고 있다고 한다. 현재 가장 비용이 많이 든 공개 모델은 우리가 익히 잘아는 GPT-4와 구글의 Gemini Ultra이다. 모델 서비스를 유지하는데도 상당한 비용이 든다. 오픈 AI는 모델 서비스를 유지하는데 하루에 70만 달러를 사용한다고 한다. 

따라서, LLM 서비스를 도입하고자 하는 기업에게는 비용 최적화가 가장 중요한 과제가 된다. 이 책에서 가장 재미있게 읽었던 3장은 LLM에 중점을 두고 추론 비용을 최적화하는 다양한 기술을 소개한다. 그중에서 한가지가 바로 프롬프트 엔지니어링이다. 프롬프트에 대한 이해도는 작업의 성능과 비용에 큰 영향을 미친다고 한다. 

 

프롬프트 엔지니어링은 LLM과 상호작용할 때 중심이 되는 기법으로, 모델이 원하는 출력을 생성할 수 있도록 프롬프트를 구성하는 것을 말한다. 


 

프롬프트와 모델의 응답에서 사용하는 각 단어나 토큰은 비용을 발생시키는데, 오픈 AI의 GPT-4o는 입력 100만 토큰당 2.50달러이고, 출력은 동일 토큰에 10달러의 비용이 든다. 이를 추정하기 위해 라이브러리 tiktoken을 활용할 수 있는데, 책에서는 예시로 요청을 보내고 tiktoken을 통해 요청의 비용을 계산하는 과정이 소개되어 있다. GPT를 사용하기만 하고, 비용에 대해서는 고려하지 않았는데 응답 한번에 상당한 비용이 소모된다는 점을 배웠다.


 

프롬프트 엔지니어링을 위해, 복잡한 질문을 더 간단한 질문 여러 개로 분해하면 조정하기 편한 응답을 얻을 수 있다. 각 질문을 순서대로 하면서, LLM이 이전 답변을 기반으로 논리적인 순서로 정보를 탐색하도록 하는 것이다. 예를 들면, 단순히 당뇨병에 대해 설명을 요구하지 않고, 당뇨병에 대한 간단한 설명 - 종류 - 세분화된 증상 - 진단 방법 - 치료 방법 순으로 질문하게 되면 사용자가 원하는 핵심적인 답변을 얻을 수 있다.


 

또는 컨텍스트를 제공해서 LLM이 정확한 응답을 할 수 있도록 만드는 방법도 있다. LLM이 사용자의 요구사항을 잘 이해하도록 프롬프트에 추가정보를 제공하는 것이다. 이외에도 LLM의 성능과 비용을 최적화하는 다양한 기술들이 있으며, 책에서는 코드를 통해 예시를 직접 보여준다. 


 

LLM 서비스 구축에 관심 있는 사람이라면 꼭 읽어보아야 할 책이다. 이 책의 주제인 비용 최적화를 위해 모델을 선택하는 과정과, 모델을 배포할 때 드는 비용과 성능에서 고려할 사항들이 다음 장에 소개된다. 설명으로 끝나지 않고, 각각의 선택지를 선택했을 때의 장단점과 예시들이 그림이나 표로 이해하기 쉽게 정리되어 있어서 각각의 모델과 배포 방법을 선택하는데 큰 도움이 될 것이다.

#LLM #최적화 #비용최적화 #AI서비스구축 #인프라 #배포튜닝 #한빛미디어 #LLM서비스설계와최적화

 

결제하기
• 문화비 소득공제 가능
• 배송료 : 2,000원배송료란?

배송료 안내

  • 20,000원 이상 구매시 도서 배송 무료
  • 브론즈, 실버, 골드회원 무료배송
닫기

리뷰쓰기

닫기
* 상품명 :
LLM 서비스 설계와 최적화
* 제목 :
* 별점평가
* 내용 :

* 리뷰 작성시 유의사항

글이나 이미지/사진 저작권 등 다른 사람의 권리를 침해하거나 명예를 훼손하는 게시물은 이용약관 및 관련법률에 의해 제재를 받을 수 있습니다.

1. 특히 뉴스/언론사 기사를 전문 또는 부분적으로 '허락없이' 갖고 와서는 안됩니다 (출처를 밝히는 경우에도 안됨).
2. 저작권자의 허락을 받지 않은 콘텐츠의 무단 사용은 저작권자의 권리를 침해하는 행위로, 이에 대한 법적 책임을 지게 될 수 있습니다.

오탈자 등록

닫기
* 도서명 :
LLM 서비스 설계와 최적화
* 구분 :
* 상품 버전
종이책 PDF ePub
* 페이지 :
* 위치정보 :
* 내용 :

도서 인증

닫기
도서명*
LLM 서비스 설계와 최적화
구입처*
구입일*
부가기호*
부가기호 안내

* 온라인 또는 오프라인 서점에서 구입한 도서를 인증하면 마일리지 500점을 드립니다.

* 도서인증은 일 3권, 월 10권, 년 50권으로 제한되며 절판도서, eBook 등 일부 도서는 인증이 제한됩니다.

* 구입하지 않고, 허위로 도서 인증을 한 것으로 판단되면 웹사이트 이용이 제한될 수 있습니다.

닫기

해당 상품을 장바구니에 담았습니다.이미 장바구니에 추가된 상품입니다.
장바구니로 이동하시겠습니까?