그림으로 배우는 생성형 AI

10 min read
TL;DR
  • 생성형 AI의 텍스트, 이미지, 에이전트, LLM옵스까지 폭넓게 훑어볼 수 있는 입문서입니다.
  • 중요한 논문 레퍼런스와 링크가 풍부해 생성형 AI 엔지니어링의 전체 지형도를 잡기에 좋습니다.
  • 일부 한자어 번역 용어와 시각화 품질 편차는 감안하고 읽는 편이 좋습니다.
오라일리 책 『그림으로 배우는 생성형 AI』 한국어판 표지

그림으로 배우는 생성형 AI

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

소개

이번 달에 리뷰할 책은 『그림으로 배우는 생성형 AI』입니다. 원제는 『Visualizing Generative AI: How AI Paints, Writes, and Assists』인데, 원제를 보면 이 책이 무엇을 하려는지 더 직관적으로 이해할 수 있습니다. 즉 AI가 그림을 그리고, 글을 쓰고, 도움을 주는 방법을 시각화한 책이죠.

저자 및 번역가

원저자는 두 분입니다. Priyanka Vergadia는 Microsoft에서 Developer Advisory 부서 시니어 디렉터로 일하고 있고, 시각적 스토리텔링으로 복잡한 클라우드와 AI 기술을 풀어내는 것으로 유명합니다. 베스트셀러였던 『Visualizing Google Cloud』의 저자이기도 합니다. Valliappa Lakshmanan(Lak)은 금융 도메인 AI 에이전트 스타트업 Obin AI의 공동 창업자이자 CTO이며, 이전에는 Google Cloud에서 Data Analytics and AI Solutions Director를 지냈고 O'Reilly에서 여러 권의 책을 낸 베테랑 저자입니다.

번역은 제가 예전에 읽었던 『아트 오브 컴퓨터 프로그래밍』을 번역하신 류광님이 맡으셨습니다. 특히 이 책은 난이도가 꽤 있는 것으로 유명한데, 10년도 더 전에 학교 도서관에서 끝까지 읽어보겠다고 몇 달간 씨름했던 추억이 떠오르네요.

폭넓은 주제

이 책의 구성부터 봅시다. 네 가지로 나뉩니다.

  1. 생성형 AI의 개념과 작동 원리, 프롬프트 활용법
  2. AI의 실제 활용 사례들
  3. 생성형 AI 애플리케이션 구축, 시스템/아키텍처 등
  4. 책임 있는 AI 사용

이미지, 텍스트, 비디오 각 생성형 AI 종류 하나만으로도 책 한 권일 텐데, 이걸 한 챕터에서 한 번에 다루다 보니 굉장히 폭넓습니다. 그렇기에 아키텍처나 전체적인 흐름을 설명하기 위해 시각화한 이미지가 많이 첨부되어 있습니다.

이런 분들에게 좋습니다

넓고 얕게 다루는 AI 엔지니어링

생성형 AI의 개념과 작동 원리를 그림과 도식으로 설명하는 책 속 시각화 예제

서론의 '우리가 이 책을 쓴 이유'를 보면 명확합니다. 현실에서 사용하는 생성형 AI 애플리케이션을 구축할 때 핵심 개념으로 남을 내용을 담은 안내서라는 거죠. 그래서 다루는 주제가 얇고 넓습니다.

생성형 AI란 무엇인가부터 시작해서 텍스트, 이미지, 머신러닝, 오디오, 동영상까지 전부 다룹니다. 각각의 활용 방식과 에이전트 시스템 구축, 랭체인, LLM옵스에 더해서 책임감 있는 AI 사용까지 이야기하죠. 주제가 이렇게 다양하다 보니 349페이지에 욱여넣기에는 부족한 내용입니다.

그런 관계로 엄청난 용어의 압박이 시작됩니다. 이게 장점이자 단점일 수 있는데, 어느 정도 용어에 친숙한 초보자에게 좋은 책이라고 생각됩니다. 완전 입문자는 어려울 겁니다. 읽다 보면 스트레스 많이 받을 거야. 하지만 그런 스트레스도 필요해.

생성형 AI 애플리케이션의 구성 요소와 흐름을 설명하는 다이어그램

중요한 논문 레퍼런스와 링크가 많음

중요한 논문들을 그동안 어느 정도는 봤다고 생각했는데, 이 책에서 놓치고 못 본 논문들을 많이 알 수 있었습니다. 하나만 예를 들면 'Textbooks are all you need' 같은 논문은 있는 줄도 몰랐다가 이 책을 통해 처음 알게 됐네요. 그 외에도 레퍼런스를 꼼꼼하게 링크해놔서 깊게 읽기 좋습니다.

Automation blindness 같은 항공 분야에서 유래한 용어를 AI에 적용해 설명한 부분도 좋았습니다.

이미지로 설명하는 예제들

생성형 AI의 학습과 활용 과정을 펜 드로잉 스타일로 설명하는 시각화 예제

시각화가 잘된 이미지들은 확실히 직관적입니다. 좋은 시각화 케이스는 정말 좋고 아닌 케이스는 아쉽다는 식으로 편차가 큰데, 잘된 쪽만 놓고 보면 분명 장점입니다. 특히 거대한 아키텍처를 한눈에 본다는 점에서 어드밴티지가 있습니다. 긴 내용을 읽고 다시 이미지로 볼 수 있으니 복습 효과도 있습니다.

그림도 너무 튀지 않게 그려져 있습니다. 요즘은 AI 삽화도 많은데, 펜 드로잉 느낌이라 좋았습니다.

아쉬운 점

최신 정보의 누락

원서 발행이 2025년 11월임에도 불구하고, 내용이 꽤 오래된 느낌입니다. 2025년에 보기엔 살짝 시점이 어긋난, 2024년에 나왔을 법한 내용들이 많아서 다소 아쉬웠습니다. 하지만 그 말은 그만큼 근본적으로 알아야 할 정보라는 뜻일 수도 있겠습니다.

아쉬운 시각화

몇몇 이미지에 글이 너무 많습니다. '굳이 이미지로 표현해야 했나' 싶은 구성이 자주 눈에 띄었는데, 내용을 시각화한 게 아니라 배경색으로 칸만 나눠놓은 수준이더군요. 개인적으로 좋아하는 만화책인 헌터×헌터 만화책 읽는 기분이었습니다.

생성형 AI와 인간의 상호작용을 만화 형식으로 설명하는 책 속 예제 헌터×헌터의 대화 장면처럼 복잡한 설명이 말풍선으로 이어지는 만화 컷

번역 용어가 오히려 장벽

가장 불편했던 부분입니다. 요즘은 AI 관련 내용을 영어 아티클이나 논문으로 접하는 경우가 많다 보니, 영어 원어가 오히려 더 직관적으로 느껴지는 상황이 많습니다. 그런데 이 책은 용어를 한자어로 바꿔놓아서 오히려 이해가 어려웠습니다.

대표적인 예가 '표집'인데, 처음엔 안 와닿아서 뭐지 했는데 '샘플링'이었습니다. 반면 '메타 프롬프팅' 같은 용어는 한글 발음 그대로 쓰여 있어서, 번역 기준이 무엇인지 종잡기가 어려웠습니다.

찾아보니 류광 번역가님의 한자어 위주 번역 스타일은 이미 예전부터 논란이 있어왔던 것 같더군요. 책 읽기 전 이 부분은 좀 감안하시면 좋을 듯합니다.

마치며

생성형 AI 전반을 한 권으로 훑어보기에 좋은 책입니다. 텍스트, 이미지, 오디오, 에이전트, LLM옵스, 책임감 있는 AI까지 핵심 주제들을 하나의 흐름으로 엮어줘서 전체 그림을 잡는 데 큰 도움이 되더군요. 중요한 논문 레퍼런스도 풍부해서, 책을 읽다가 따로 파볼 만한 주제를 자연스럽게 발견하게 됩니다.

기본 용어에 어느 정도 익숙한 분이라면, 생성형 AI 엔지니어링의 지형도를 머릿속에 그리는 데 추천할 만한 책이네요.