Projektowanie aplikacji LLM. Holistyczne podejście do dużych modeli językowych – recenzja

Projektowanie aplikacji LLM. Holistyczne podejście do dużych modeli językowych – recenzja

W książce można dowiedzieć się, że przy trenowaniu modeli w OpenAI pracowały 343 osoby, bez etykietujących. I co ważniejsze: jest wyjaśnione, dlaczego tak dużo. To nie jest ciekawostka dla kliknięć. To jest kontekst, który pokazuje skalę złożoności i odpowiedzialności.

Sam tytuł książki może zmylić. Można sądzić, że to będzie książka o samej „integracji” modeli z aplikacją albo przegląd kilku modnych technik. A tymczasem dostajemy coś znacznie więcej. Zgodnie z podtytułem: podejście naprawdę holistyczne.

Autor zaczyna tam, gdzie powinno się zaczynać rozmowę o AI – od danych treningowych. I to jest duży plus. Nie ma tu skrótów myślowych. Jest proces. Jest wybór danych, ich jakość, konsekwencje decyzji projektowych. I dopiero później kolejne etapy.

To połączenie tekstu technicznego i ciekawostek działa bardzo dobrze. Z jednej strony mamy konkret: funkcje, techniki, fragmenty kodu źródłowego, opisane na poziomie „nie za szczegółowo, nie za ogólnie”. W sam raz, żeby zrozumieć mechanizm, ale się nie utopić.

Z drugiej strony wtrącenia, historie, liczby, kulisy. Dzięki temu książka nie jest suchym podręcznikiem. Co ważne, autor nie skupia się tylko na „jak to działa”, ale też na konsekwencjach działania.

  • wydajności,
  • kosztach,
  • opóźnieniach.

To bardzo praktyczne podejście. Widać, że to nie jest teoria oderwana od realiów.

To zdecydowanie nie jest książka dla początkujących. Wymaga solidnej wiedzy na start, Zwłaszcza z budowy LLM-ów. Jeżeli ktoś nie rozumie, czym jest self-attention, embedding czy pipeline treningowy, będzie się męczył.

Momentami nawet osoba techniczna może się zgubić. Zdarzały mi się sytuacje, że trafiałem na pojęcie, którego nie znałem. Wracałem kilka stron wcześniej, szukałem wyjaśnienia… i go nie było. To męczące.

Nie wszystkie przejścia między etapami książki są jasne. Czasem zmiana tematu jest zbyt gwałtowna. Brakuje jednego zdania mostu, które uporządkowałoby tok myślenia.

Do tego dochodzą problemy z tłumaczeniem. Są dziwne sformułowania, które wytrącają z flow czytania. Widać też pojedyncze błędy. To szkoda, bo książka jest wymagająca sama w sobie, nie powinna dodatkowo męczyć językowo.

Duży plus za ćwiczenia. Nawet jeśli ich nie robię, zmuszają do zatrzymania się i przemyślenia tematu. Dzięki temu to nie jest kolejna lektura do szybkiego przejrzenia

Bardzo doceniam też konsekwentne zwracanie uwagi na bezpieczeństwo w całym procesie. Od danych, przez trening, po wdrożenie. Nie jako dodatek, ale jako element systemu.

To książka trudna. Szczególnie pierwsza część. Momentami wymagająca.

Ale jednocześnie daje więcej, niż obiecuje i świetnie porządkuje temat budowy modeli LLM i agentów. Jeżeli masz techniczne podstawy i chcesz naprawdę zrozumieć, jak działają współczesne modele językowe, nie tylko od strony promptów, ale od fundamentów, to polecam.

%d bloggers like this: