<?xml version="1.0" encoding="UTF-8"?><rss xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:atom="http://www.w3.org/2005/Atom" version="2.0"><channel><title><![CDATA[Рекомендации для изучения промтинга LLM]]></title><description><![CDATA[<h3><strong>Обязательно к изучению для любого технаря: как эффективно работать с LLM через промты</strong></h3>
<p dir="auto">Эта книга – <strong>must-read</strong> для понимания принципов составления промтов (запросов) к большим языковым моделям (LLM). Без этих знаний взаимодействие с ИИ будет поверхностным и неэффективным.</p>
<blockquote>
<p dir="auto"><strong>Что такое LLM?</strong> (Spoiler)<br />
Большая языковая модель (LLM) – это нейросеть, обученная на <strong>огромных массивах текстовых данных</strong> (книги, статьи, код, диалоги). Её ключевые особенности:</p>
<ul>
<li><strong>Миллиарды параметров</strong> – чем их больше, тем "умнее" модель.</li>
<li><strong>Понимание контекста</strong> – LLM улавливают связи между словами, идеями и даже абстрактными концепциями.</li>
<li><strong>Генерация текста</strong> – от простых ответов до сложных аналитических выводов.</li>
<li><strong>Мультизадачность</strong> – перевод, суммаризация, программирование, креативное письмо и многое другое.</li>
</ul>
</blockquote>
<p dir="auto"><img src="https://celua.ru/assets/plugins/nodebb-plugin-emoji/emoji/android/1f4d6.png?v=fa7650fc758" class="not-responsive emoji emoji-android emoji--book" style="height:23px;width:auto;vertical-align:middle" title="📖" alt="📖" /> <strong>Где прочитать?</strong><br />
- <strong><a href="https://www.kaggle.com/whitepaper-prompt-engineering" target="_blank" rel="noopener noreferrer nofollow ugc">Kaggle (требуется аккаунт)</a></strong><br />
- <strong><a href="https://drive.google.com/file/d/1AbaBYbEa_EbPelsT40-vj64L-2IwUJHy/view" target="_blank" rel="noopener noreferrer nofollow ugc">PDF (Google Drive, прямое скачивание)</a></strong></p>
<p dir="auto">---</p>
<h3><strong><img src="https://celua.ru/assets/plugins/nodebb-plugin-emoji/emoji/android/1f527.png?v=fa7650fc758" class="not-responsive emoji emoji-android emoji--wrench" style="height:23px;width:auto;vertical-align:middle" title="🔧" alt="🔧" /> Полный план погружения в мир LLM и промт-инжиниринга</strong></h3>
<h4><strong>1️⃣ VPN – без него никуда</strong></h4>
<p dir="auto">Современные технологии развиваются <strong>там, где нет блокировок</strong>. Без VPN вы:<br />
- <strong>Не получите доступ</strong> к лучшим LLM (Claude, Gemini, некоторые версии GPT).<br />
- <strong>Не сможете</strong> тестировать API (например, через OpenRouter).<br />
- <strong>Пропустите</strong> ключевые обучающие материалы (курсы, документация, обсуждения).<br />
<img src="https://celua.ru/assets/plugins/nodebb-plugin-emoji/emoji/android/1f539.png?v=fa7650fc758" class="not-responsive emoji emoji-android emoji--small_blue_diamond" style="height:23px;width:auto;vertical-align:middle" title="🔹" alt="🔹" /> <em>Да, VPN – это дополнительный шаг, но без него вы останетесь в "информационном вакууме".</em></p>
<h4><strong>2️⃣ Промт-инжиниринг – искусство формулировки запросов</strong></h4>
<p dir="auto">- Это <strong>не просто "задать вопрос"</strong>, а <strong>контролировать вывод модели</strong>.<br />
- Нужно учиться:</p>
<ul>
<li><strong>Чётко ставить задачи</strong> ("напиши код" vs. "напиши оптимизированную функцию на Python, которая...").</li>
<li><strong>Управлять форматом ответа</strong> (JSON, Markdown, таблицы).</li>
<li><strong>Использовать примеры</strong> (few-shot prompting).<br />
<img src="https://celua.ru/assets/plugins/nodebb-plugin-emoji/emoji/android/1f539.png?v=fa7650fc758" class="not-responsive emoji emoji-android emoji--small_blue_diamond" style="height:23px;width:auto;vertical-align:middle" title="🔹" alt="🔹" /> <em>Книга выше – отличный старт, но дальше нужно экспериментировать.</em></li>
</ul>
<h4><strong>3️⃣ Архитектура Transformer – основа всех современных LLM</strong></h4>
<p dir="auto">- <strong>Сложная?</strong> Да. <strong>Можно разобраться в базе?</strong> Абсолютно.<br />
- Ключевые компоненты:</p>
<ul>
<li><strong>Self-Attention</strong> – как модель "понимает" связи между словами.</li>
<li><strong>Токенизация</strong> – как текст превращается в числа.</li>
<li><strong>Контекстное окно</strong> – почему модели "забывают" начало длинного текста.<br />
<img src="https://celua.ru/assets/plugins/nodebb-plugin-emoji/emoji/android/1f539.png?v=fa7650fc758" class="not-responsive emoji emoji-android emoji--small_blue_diamond" style="height:23px;width:auto;vertical-align:middle" title="🔹" alt="🔹" /> <em>Рекомендую видео с VPN (например, MIT или Stanford лекции).</em></li>
</ul>
<h4><strong>4️⃣ Запустите локальную модель (хотя бы 7B параметров)</strong></h4>
<p dir="auto">- <strong>Почему?</strong> Чтобы понять <strong>ограничения</strong> LLM.<br />
- Примеры: <strong>Llama 3, Mistral, Phi-3</strong>.<br />
- Сравните ответы с <strong>GPT-4o или Claude 3</strong> – разница будет очевидна.<br />
<img src="https://celua.ru/assets/plugins/nodebb-plugin-emoji/emoji/android/1f539.png?v=fa7650fc758" class="not-responsive emoji emoji-android emoji--small_blue_diamond" style="height:23px;width:auto;vertical-align:middle" title="🔹" alt="🔹" /> <em>Это даст понимание, когда использовать облачные модели, а когда хватит локальных.</em></p>
<h4><strong>5️⃣ Google Android Studio AI – скрытый gem</strong></h4>
<p dir="auto">- Два окна: <strong>ваш запрос</strong> vs. <strong>результат</strong>.<br />
- Идеально для:</p>
<ul>
<li>Сравнения разных формулировок.</li>
<li>Тестирования <strong>контекстного понимания</strong>.</li>
<li>Экспериментов с <strong>кодогенерацией</strong>.</li>
</ul>
<h4><strong>6️⃣ Работа с API (DeepSeek, OpenRouter и др.)</strong></h4>
<p dir="auto">- <strong>Что важно изучить:</strong></p>
<ul>
<li><strong>Роли (<code>system</code>, <code>user</code>, <code>assistant</code>)</strong> – как управлять поведением модели.</li>
<li><strong>Параметры (<code>temperature</code>, <code>top_p</code>, <code>max_tokens</code>)</strong> – тонкая настройка ответов.</li>
<li><strong>Streaming</strong> – как получать ответ по частям.<br />
<img src="https://celua.ru/assets/plugins/nodebb-plugin-emoji/emoji/android/1f539.png?v=fa7650fc758" class="not-responsive emoji emoji-android emoji--small_blue_diamond" style="height:23px;width:auto;vertical-align:middle" title="🔹" alt="🔹" /> <em>Попробуйте отправить запрос с разными параметрами и сравните вывод.</em></li>
</ul>
<h4><strong>7️⃣ AI-агенты – следующий уровень автоматизации</strong></h4>
<p dir="auto">- <strong>Как работают?</strong> Модель генерирует <strong>JSON-инструкции</strong>, которые выполняет агент.<br />
- <strong>Примеры использования:</strong></p>
<ul>
<li><strong>Автоматические сводки новостей</strong> (агент парсит сайты и присылает вам на почту).</li>
<li><strong>Локальные скрипты</strong> (например, агент переименовывает файлы по заданному шаблону).<br />
- <strong>Сервисы для быстрого создания агентов:</strong></li>
<li><strong>AutoGPT</strong></li>
<li><strong>LangChain</strong></li>
<li><strong>Microsoft Autogen</strong></li>
</ul>
<p dir="auto">---</p>
<h3><strong><img src="https://celua.ru/assets/plugins/nodebb-plugin-emoji/emoji/android/1f4a1.png?v=fa7650fc758" class="not-responsive emoji emoji-android emoji--bulb" style="height:23px;width:auto;vertical-align:middle" title="💡" alt="💡" /> Зачем всё это нужно?</strong></h3>
<table class="table table-bordered table-striped">
<thead>
<tr>
<th>Преимущество</th>
<th>Пример</th>
</tr>
</thead>
<tbody>
<tr>
<td><strong>Избавление от рутины</strong></td>
<td>Автоматизация документооборота, генерация отчётов.</td>
</tr>
<tr>
<td><strong>Ускорение разработки</strong></td>
<td>Поиск багов, написание тестов, объяснение кода.</td>
</tr>
<tr>
<td><strong>Доступ к знаниям</strong></td>
<td>Вместо чтения документации – сразу рабочий пример.</td>
</tr>
<tr>
<td><strong>Кастомизация</strong></td>
<td>Агенты под ваши конкретные задачи (например, мониторинг соцсетей).</td>
</tr>
</tbody>
</table>
<p dir="auto"><img src="https://celua.ru/assets/plugins/nodebb-plugin-emoji/emoji/android/1f539.png?v=fa7650fc758" class="not-responsive emoji emoji-android emoji--small_blue_diamond" style="height:23px;width:auto;vertical-align:middle" title="🔹" alt="🔹" /> <strong>Промт-инжиниринг – это "программирование 2.0"</strong>, где вы управляете не кодом, а <strong>интеллектом</strong>.</p>
<p dir="auto">---</p>
<h3><strong><img src="https://celua.ru/assets/plugins/nodebb-plugin-emoji/emoji/android/1f680.png?v=fa7650fc758" class="not-responsive emoji emoji-android emoji--rocket" style="height:23px;width:auto;vertical-align:middle" title="🚀" alt="🚀" /> Что дальше?</strong></h3>
<p dir="auto">- <strong>Экспериментируйте</strong> с разными моделями.<br />
- <strong>Тестируйте</strong> агентов на реальных задачах.<br />
- <strong>Делитесь</strong> промтами – это новая форма коллективного знания.</p>
<p dir="auto"><em>P.S. Да, тема огромная, но начать можно с малого – книги и пары экспериментов. Главное – не останавливаться!</em></p>
]]></description><link>https://celua.ru/topic/161/рекомендации-для-изучения-промтинга-llm</link><generator>RSS for Node</generator><lastBuildDate>Sat, 18 Apr 2026 11:31:01 GMT</lastBuildDate><atom:link href="https://celua.ru/topic/161.rss" rel="self" type="application/rss+xml"/><pubDate>Sun, 27 Jul 2025 14:41:07 GMT</pubDate><ttl>60</ttl><item><title><![CDATA[Reply to Рекомендации для изучения промтинга LLM on Sun, 27 Jul 2025 14:45:47 GMT]]></title><description><![CDATA[<h3><strong><img src="https://celua.ru/assets/plugins/nodebb-plugin-emoji/emoji/android/1f310.png?v=fa7650fc758" class="not-responsive emoji emoji-android emoji--globe_with_meridians" style="height:23px;width:auto;vertical-align:middle" title="🌐" alt="🌐" /> Мультимодальные LLM: когда ИИ видит, слышит и понимает контекст</strong></h3>
<p dir="auto"><strong>Что это?</strong><br />
Модели, способные <strong>одновременно обрабатывать текст, изображения, аудио и видео</strong>. Это не просто "распознавание картинок", а <strong>глубокое понимание связей</strong> между разными типами данных.</p>
<blockquote>
<p dir="auto"><strong>Пример работы:</strong><br />
Загружаете фото схемы электронной платы + текстовый запрос: <em>"Найди ошибку в разводке конденсатора C7 и предложи исправление в формате KiCad"</em>.<br />
Модель:<br />
1️⃣ Анализирует изображение,<br />
2️⃣ Сопоставляет с текстовым контекстом,<br />
3️⃣ Генерирует инструкцию с исправлением.</p>
</blockquote>
<p dir="auto">---</p>
<h4><img src="https://celua.ru/assets/plugins/nodebb-plugin-emoji/emoji/android/1f527.png?v=fa7650fc758" class="not-responsive emoji emoji-android emoji--wrench" style="height:23px;width:auto;vertical-align:middle" title="🔧" alt="🔧" /> <strong>Ключевые возможности и применение</strong></h4>
<table class="table table-bordered table-striped">
<thead>
<tr>
<th><strong>Тип данных</strong></th>
<th><strong>Что умеет модель</strong></th>
<th><strong>Практическое применение</strong></th>
</tr>
</thead>
<tbody>
<tr>
<td><strong>Текст + Изображение</strong></td>
<td>Описание сцен, анализ графиков, чтение рукописных заметок</td>
<td>Автоматизация документооборота, генерация ALT-текста, поиск дефектов на чертежах</td>
</tr>
<tr>
<td><strong>Текст + Аудио</strong></td>
<td>Транскрибация с контекстным анализом, генерация эмоциональной речи</td>
<td>Виртуальные ассистенты с "характером", анализ колл-центров, озвучка презентаций</td>
</tr>
<tr>
<td><strong>Видео + Текст</strong></td>
<td>Понимание сюжета, поиск ключевых моментов, аннотирование</td>
<td>Автосуммаризация записей встреч, модерация контента, создание монтажных листов</td>
</tr>
</tbody>
</table>
<p dir="auto">---</p>
<h4><img src="https://celua.ru/assets/plugins/nodebb-plugin-emoji/emoji/android/2699.png?v=fa7650fc758" class="not-responsive emoji emoji-android emoji--gear" style="height:23px;width:auto;vertical-align:middle" title="⚙" alt="⚙" />️ <strong>Как работать с мультимодальностью?</strong></h4>
<ol>
<li>
<p dir="auto"><strong>Выбор инструментов:</strong></p>
<ul>
<li><strong>OpenAI GPT-4o</strong> (<code>vision</code> + <code>text</code> + <code>voice</code>) — через API или ChatGPT.</li>
<li><strong>Google Gemini 1.5</strong> — поддерживает до 1 млн токенов контекста (включая видео!).</li>
<li><strong>Open-source</strong>: LLaVA, Fuyu-8B (можно запустить локально с GPU).</li>
</ul>
</li>
<li>
<p dir="auto"><strong>Специфика промтов:</strong></p>
<ul>
<li><strong>Четко указывайте тип данных:</strong><br />
<em>"Проанализируй <em>скриншот ошибки</em> (вложение 1) и <em>лог-файл</em> (вложение 2). Предложи 3 решения."</em></li>
<li><strong>Управляйте фокусом:</strong><br />
<em>"Сравни графики продаж за 2023 и 2024 (PDF-страница 5). Сосредоточься на падении в Q3."</em></li>
<li><strong>Используйте ролевые модели:</strong><br />
<em>"Ты инженер-электронщик. По фото прототипа определи, где перегревается компонент."</em></li>
</ul>
</li>
<li>
<p dir="auto"><strong>Технические требования:</strong></p>
<ul>
<li>Для локальных моделей: <strong>GPU с 8+ GB VRAM</strong> (например, LLaVA-1.6 требует NVIDIA RTX 3090).</li>
<li>В облаке: <strong>API с поддержкой <code>multipart/form-data</code></strong> (для загрузки бинарных файлов).</li>
</ul>
</li>
</ol>
<p dir="auto">---</p>
<h3><img src="https://celua.ru/assets/plugins/nodebb-plugin-emoji/emoji/android/1f680.png?v=fa7650fc758" class="not-responsive emoji emoji-android emoji--rocket" style="height:23px;width:auto;vertical-align:middle" title="🚀" alt="🚀" /> <strong>Зачем это технарю?</strong></h3>
<p dir="auto">- <strong>Автоматизация сложных задач:</strong></p>
<blockquote>
<p dir="auto"><em>Запрос:</em> "По видео сборки робота составь checklist для тестирования (вывод в Markdown)".<br />
<em>Результат:</em> Готовый чеклист с привязкой к временным меткам.<br />
- <strong>Работа с документацией:</strong><br />
Анализ <strong>сканов ТУ, схем, диаграмм</strong> без ручного ввода данных.<br />
- <strong>Быстрый прототипинг:</strong><br />
<em>"Сгенерируй UI для приложения по этому наброску на салфетке (фото) + описание функционала (текст)"</em>.</p>
</blockquote>
<p dir="auto">---</p>
<h4><img src="https://celua.ru/assets/plugins/nodebb-plugin-emoji/emoji/android/26a0.png?v=fa7650fc758" class="not-responsive emoji emoji-android emoji--warning" style="height:23px;width:auto;vertical-align:middle" title="⚠" alt="⚠" />️ <strong>Ограничения (на 2025 год):</strong></h4>
<p dir="auto">- <strong>Точность распознавания:</strong> Может ошибаться в деталях (например, номера микросхем на фото).<br />
- <strong>Контекстное окно:</strong> Видео длительностью &gt;10 мин часто требуют препроцессинга.<br />
- <strong>Стоимость:</strong> Мультимодальные API в 3-5x дороже текстовых (например, GPT-4o vision — $5-15 за 1к запросов).</p>
<p dir="auto">---</p>
<h3><img src="https://celua.ru/assets/plugins/nodebb-plugin-emoji/emoji/android/1f52e.png?v=fa7650fc758" class="not-responsive emoji emoji-android emoji--crystal_ball" style="height:23px;width:auto;vertical-align:middle" title="🔮" alt="🔮" /> <strong>Как начать?</strong></h3>
<ol>
<li>Поэкспериментируйте в <strong>Google Gemini</strong> (бесплатно) с загрузкой PDF/изображений.</li>
<li>Для кода: <strong>Llama 3 с LLaVA</strong> (<a href="https://github.com/haotian-liu/LLaVA" target="_blank" rel="noopener noreferrer nofollow ugc">туториал</a>).</li>
<li>Протестируйте API через <strong>OpenRouter</strong> (поддержка &gt;30 мультимодальных моделей).</li>
</ol>
<blockquote>
<p dir="auto"><strong>Главный принцип:</strong> Мультимодальность — не замена текстовым LLM, а <strong>мощное расширение для задач, где контекст требует визуала или звука</strong>.</p>
</blockquote>
]]></description><link>https://celua.ru/post/493</link><guid isPermaLink="true">https://celua.ru/post/493</guid><dc:creator><![CDATA[MasterGH]]></dc:creator><pubDate>Sun, 27 Jul 2025 14:45:47 GMT</pubDate></item></channel></rss>