
Как мы в ТекстЗаводе усмирили Claude и Gemini, чтобы они писали фактурные тексты для сложного B2B
Лучшие ИИ для создания контента — не те, которые выдают текст быстрее. А те, которые не врут. Claude 3.5 Sonnet и Google Gemini 1.5 Pro сегодня закрывают большинство задач B2B-контента при правильной архитектуре промпта и жестком контексте из SERP. Без этого оба инструмента галлюцинируют с одинаковым энтузиазмом.
Ниже — о том, почему нейросети врут даже в хорошо известных темах, как RAG-технология меняет картину и что конкретно мы делаем в ТекстЗаводе, чтобы инженер тратил 5 минут на вычитку вместо 3 часов на переписывание. Разберем три блока: природу галлюцинаций и способ их подавить, борьбу с канцеляритом через negative prompts, и реальный кейс из промышленной ниши.
Почему нейросети врут и что с этим реально делать
Галлюцинации — не баг конкретной модели. Это архитектурное свойство любого LLM.
Языковая модель предсказывает следующий токен на основе статистики по обучающей выборке. Она не «знает» факты в человеческом смысле — она знает, какие слова стоят рядом чаще всего. Спроси у Claude про марки стали для криогенного оборудования — он выдаст правдоподобный набор: AISI 304, 316L, возможно 9% никелевую сталь. Часть будет верной. Часть — технически близкой, но неприменимой к конкретному ГОСТу. Разница принципиальная, если текст читает технолог.
Проблема усугубляется отсечкой обучающих данных. GPT-4o отсечен на начале 2024 года, Claude 3.5 — примерно там же. Актуальные нормативы, свежие редакции технических регламентов, обновленные допуски — всего этого в модели нет. Она достраивает по аналогии.
RAG как способ дать модели реальный контекст
RAG (Retrieval-Augmented Generation) — подход, при котором модель получает не только промпт, но и актуальный документ из внешней базы. Схема простая: запрос → поиск релевантных фрагментов → передача этих фрагментов модели вместе с заданием. Модель уже не гадает — она суммаризирует то, что ей дали.
В ТекстЗаводе мы реализовали логику, близкую к RAG, через SERP-контекст. Перед генерацией платформа парсит топ-30 Яндекса по целевому запросу и передает извлеченные смысловые блоки в промпт. Модель работает не с воображаемыми фактами, а с тем, что реально ранжируется прямо сейчас. Это не стопроцентная страховка от ошибок, но частота фактических несоответствий падает кратно.
Дополнительный слой — профиль компании. Клиент загружает спецификации, продуктовые листы, глоссарий терминов. Все это становится «жестким контекстом», который модель обязана учитывать. Если в профиле прописано, что компания работает с ГОСТ Р 52630-2012, нейросеть не будет писать про стандарты ASME, даже если они статистически более вероятны в обучающей выборке.
Чем отличаются Claude и Gemini в работе с фактурой
Вопрос не в том, какая модель «лучше». Вопрос — для какой задачи.
| Модель | Сильная сторона | Слабое место | Оптимальная задача |
|---|---|---|---|
| Claude 3.5 Sonnet | Следование инструкциям, длинный контекст (200k токенов) | Слабее в поиске актуальных данных | Длинные лонгриды, техдокументация, строгий ToV |
| Gemini 1.5 Pro | Интеграция с поиском, мультимодальность | Менее предсказуем по структуре | Фактчекинг, обработка PDF, таблицы |
| GigaChat | Русскоязычный контекст, доступ без VPN | Уступает по глубине рассуждений | Короткие тексты, локальный контент |
| YandexGPT 5 | Оптимизирован под Яндекс-выдачу | Ограниченный контекст | SEO-тексты под Рунет |
На практике мы используем Claude для генерации основного полотна статьи и Gemini для верификации фактических блоков. Два прохода дороже по токенам, но дешевле по времени редактора.
LLM предсказывает вероятность токена, а не проверяет факты. Это статистическая имитация знаний.
Модели ограничены датой обучения. Свежие ГОСТы и регламенты 2024 года достраиваются по аналогии.
Канцелярит и нейроштампы — почему это не просто «некрасиво»
Фразы вроде «инновационный подход» или «широкий спектр услуг» — не просто раздражающие клише. Это сигналы для алгоритмов Яндекса и Google, что перед ними слабый AI-контент.
Поисковики с 2024 года активно используют детекторы машинного текста в ранжировании. Яндекс прямо упоминает «признаки автоматической генерации» в своих рекомендациях для вебмастеров. Google в обновлении Helpful Content 2024 года дополнительно ужесточил требования к оригинальности и экспертности. Текст, набитый нейроштампами, получает пессимизацию — даже если по всем остальным параметрам он технически корректен.
Negative Prompts: как отсекать мусор на входе
Negative prompt — это явный список запретов внутри промпта. Модель инструктируется не использовать конкретные слова, конструкции и паттерны. Это не просьба «пиши хорошо» — это жесткое ограничение, которое модель соблюдает значительно строже, чем позитивные инструкции.
В ТекстЗаводе negative prompt формируется из трех источников:
Универсальный черный список — слова и фразы, которые ИИ-детекторы маркируют с вероятностью выше 80%: «осуществляет», «данный», «является», «широкий спектр», «в рамках», «на сегодняшний день». Список обновляется по мере изменения сигнатур детекторов.
Отраслевой фильтр — для IT-компании это запрет на «инновационные решения» и «передовые технологии». Для юридической фирмы — на «качественные юридические услуги» и «команду профессионалов». Каждая ниша имеет свой набор маркеров, по которым ее тексты выглядят машинными.
Бренд-специфичный список — клиент добавляет слова, которые не соответствуют его ToV. Некоторые компании запрещают неформальный тон, другие — наоборот, требуют убрать официоз.
Комбинация этих трех слоев срабатывает на этапе генерации. Модель не пишет запрещенные конструкции, а не переписывает их потом. Это принципиальная разница: постфактум редактирование оставляет следы машинного паттерна в синтаксисе, даже если конкретные слова заменены.

Как работает проверка «человечности» текста
После генерации каждый текст в ТекстЗаводе проходит два независимых прогона.
Первый — антиплагиат через text.ru. Здесь важна не только уникальность относительно других сайтов, но и академическая тошнота: частота повторений одного слова, водность, переспам ключевых фраз. Текст с тошнотой выше 9% уходит на доработку автоматически.
Второй — AI-детекция. Тот же text.ru дает оценку вероятности машинного происхождения. Порог для публикации — не выше 20% по детектору. На практике тексты, прошедшие через профиль компании и negative prompts, укладываются в 10-15%.
Это не магия — это чистая математика. Burstiness (вариативность длины предложений), Perplexity (непредсказуемость следующего слова) и соблюдение ToV конкретного бренда в сумме дают текст, который детекторы квалифицируют как человеческий.
Что происходит, если пропустить этот этап
Ситуация типичная. Маркетолог генерирует 20 статей для IT-компании, публикует без проверки. Через 2-3 месяца трафик не растет. SEO-аудит показывает: тексты пессимизированы фильтром за машинный контент. Все 20 статей надо переписывать.
Стоимость переработки — время редактора плюс повторная публикация. В среднем это 3-4 недели работы и откат позиций ещё на месяц, пока поисковик переиндексирует страницы. Двойная проверка на входе дешевле любого сценария с переработкой.
Кейс: технически сложная ниша, промышленное оборудование
Промышленное оборудование — один из сложнейших случаев для AI-контента. Марки стали, технические допуски, классы точности, ссылки на ГОСТы — всё это либо конкретно, либо неверно. Среднего не бывает.
Клиент — производитель трубопроводной арматуры для нефтегазового сектора. Задача: серия из 12 статей под SEO, каждая на 12 000-15 000 знаков. Целевая аудитория — инженеры-проектировщики и снабженцы, которые умеют отличать ГОСТ 5762 от ГОСТ 12815.
Проблема: откуда берутся технические ошибки
Без профиля компании Claude работает со своей базой знаний. По трубопроводной арматуре в этой базе есть общие сведения, западные стандарты (API, DIN, EN), и усредненные технические описания. Первый черновик содержал три типа ошибок:
- Указание марок стали, не применяемых в российской нефтегазовой отрасли (15X5M вместо 12X1MФ для высокотемпературных применений).
- Допуски по ASME B16.34 вместо ГОСТ 33259 для фланцевых соединений.
- Некорректные температурные диапазоны: модель взяла типичные значения, не учитывая специфику изделий конкретного завода.
Инженер нашел 11 ошибок за 40 минут вычитки. С точки зрения времени — уже лучше, чем писать с нуля. Но для публикации текст не годился.
Решение: профиль компании как технический паспорт
В профиль компании загрузили три документа:
- Сводную таблицу применяемых марок стали с привязкой к типам изделий и температурным диапазонам.
- Перечень действующих ГОСТов, по которым сертифицирована продукция: ГОСТ 5762-2002, ГОСТ 33259-2015, ГОСТ 9544-2015 для классов герметичности.
- Глоссарий терминов — как называются конкретные детали в документации завода, а не в общем машиностроительном словаре.
После загрузки профиля и настройки промпта модель получала эти данные как жесткий контекст перед каждой генерацией. Не как «учти, если можешь», а как обязательный источник, которому нужно соответствовать.
Результат: что изменилось в цифрах
Второй черновик той же статьи — 14 800 знаков, все ГОСТы верные, марки стали соответствуют реальной продуктовой линейке.
Инженер потратил на вычитку 5 минут. Нашел одно замечание по стилю — не по фактуре. Статья ушла на публикацию без переработки.
Если считать честно: раньше написание одной такой статьи занимало у технического редактора 6-8 часов. Из них 2-3 часа уходило на сбор фактуры, ещё 3-4 — на написание и правки. После внедрения профиля компании в ТекстЗаводе время эксперта сократилось до 15-20 минут на статью. Это не экономия — это другая модель работы.
Хотите проверить, как профиль компании работает на вашей нише? Создайте профиль на textzavod.ru и запустите тестовую генерацию — первый результат увидите за 15 минут.
Масштабирование: что происходит при серии из 12 статей
Двенадцать статей по 14 000 знаков — это 168 000 знаков контента. При ручном производстве с техническим редактором — минимум 6 недель работы. В ТекстЗаводе серия генерировалась за 3 рабочих дня: 1 день на настройку профиля и контент-план, 2 дня на генерацию с промежуточными правками промпта.
Инженер провел финальную вычитку всей серии за один рабочий день. Среднее время на статью — 22 минуты. Экономия времени эксперта по сравнению с ручным производством — порядка 90-95%.
Важный момент: три статьи из двенадцати потребовали дополнительной итерации генерации. Это нормально — профиль компании не устраняет все ошибки в первом проходе, особенно в нестандартных темах. Реалистичный показатель для сложной технической ниши — 70-80% статей уходят с первого прохода, остальные требуют одной корректировки промпта.
Идеален для лонгридов и строгого ToV. Точно следует сложным инструкциям.
Лучший в фактчекинге и поиске. Используется для сверки данных.
Понимает специфику РФ и доступен без ограничений. Короткие форматы.
Заточен под алгоритмы Яндекса. Эффективен для мета-тегов и описаний.
Как выбрать ИИ под конкретную задачу B2B-контента
Нет универсальной лучшей нейросети для написания статей. Есть правильное распределение задач между инструментами.
Архитектура, которая работает на практике:
Сбор фактуры и SERP-анализ — автоматизированный парсинг топа выдачи. Это не задача модели, это задача инфраструктуры. Модель получает уже обработанные данные.
Генерация структуры — Claude справляется лучше за счет точного следования инструкциям. Дайте ему список требований к структуре, целевую аудиторию и объем — он выдаст логичный план без лирики.
Написание технических разделов — Claude с профилем компании. Gemini — если нужна верификация через актуальный поиск.
Проверка фактуры — отдельный прогон через Gemini с функцией grounding (заземления на реальные источники). Или ручная сверка инженера, если цена ошибки высока.
Контроль качества текста — антиплагиат и AI-детекция через text.ru перед публикацией.
Это не пайплайн для одной статьи. Это архитектура для производства 50-100 статей в месяц без потери качества.

Критерии выбора: чек-лист для B2B
| Критерий | Что проверить | Минимальный порог |
|---|---|---|
| Уникальность | text.ru антиплагиат | >95% |
| AI-детекция | text.ru нейросетевой анализ | <20% вероятность машинного текста |
| Академическая тошнота | Advego или text.ru | <9% |
| Плотность ключей | Advego семантический анализ | 1-2% по главному ключу |
| Фактическая точность | Ручная сверка эксперта | 0 критических ошибок |
| Соответствие ToV | Субъективная оценка редактора | По брендбуку |
Первые четыре критерия автоматизируются. Последние два требуют человека — но только его.
- ✕ «Инновационный подход»
- ✕ «Широкий спектр услуг»
- ✕ «На сегодняшний день»
Часто задаваемые вопросы
Можно ли использовать лучшие ГПТ для написания текста в технической нише без правок человека?
Нет, и это не изменится в ближайшее время. Даже с профилем компании и RAG-контекстом модель может ошибиться в деталях, которых нет в загруженных документах. Задача ИИ — сократить время эксперта с 6 часов до 20 минут, а не заменить его полностью. Человек проверяет факты, нейросеть пишет текст — это рабочее разделение труда для сложных ниш.
Как RAG-технология защищает от галлюцинаций на практике?
RAG дает модели конкретный документ или фрагмент текста как обязательный источник перед генерацией. Вместо того чтобы «вспоминать» из обучающей выборки, модель суммаризирует предоставленный материал. Это не исключает ошибки, но меняет их характер: вместо выдуманных фактов вы получаете неточную интерпретацию реальных данных — что исправить значительно проще.
Какая нейросеть лучше подходит для написания статей по юридической тематике?
Claude 3.5 Sonnet за счет большого контекстного окна (до 200 000 токенов) может принять полный текст нормативного акта и писать на его основе. Для российской юридической практики критично загружать актуальные редакции законов в профиль — модели не знают поправок, внесенных после отсечки обучения. GigaChat показывает хорошие результаты в работе с российским правом, но проигрывает Claude по глубине анализа сложных правовых конструкций.
Что такое negative prompt и насколько он эффективен против нейроштампов?
Negative prompt — это список запретов в теле промпта: конкретные слова, фразы и конструкции, которые модель не должна использовать. Эффективность высокая: при правильно составленном списке из 30-50 запрещенных паттернов частота нейроштампов в тексте снижается на 70-90% по сравнению с базовым промптом. Ключевое условие — запреты должны быть конкретными («не используй слово “осуществляет”»), а не абстрактными («пиши живым языком»).
Как ТекстЗавод решает проблему актуальности данных в быстро меняющихся нишах?
Платформа парсит актуальный топ-30 Яндекса по каждому запросу непосредственно перед генерацией. Это дает срез того, что реально ранжируется сейчас, — включая свежие материалы, вышедшие после отсечки обучения модели. Для нормативной базы и технических стандартов этого недостаточно: их нужно загружать в профиль компании вручную. Комбинация SERP-контекста и профиля закрывает большинство ситуаций.
Самый лучший ИИ для написания текстов — это платный инструмент или можно обойтись бесплатным?
Бесплатные версии Claude и Gemini работают с урезанным контекстным окном и без возможности системного промпта — двух функций, без которых контроль качества в сложных нишах невозможен. Для единичных текстов бесплатные версии подойдут. Для производства 20+ статей в месяц с техническим контролем нужны платные API или специализированные платформы, которые уже встроили нужную инфраструктуру.
Как проверить, что текст не будет пессимизирован поисковиком за машинное происхождение?
Минимальный набор проверок: text.ru на уникальность (>95%), тот же сервис на AI-детекцию (<20%), Advego на тошноту (<9%). Если все три показателя в норме, риск пессимизации за технические признаки машинного текста минимален. Содержательная экспертность — отдельный вопрос, её алгоритм оценивает по поведенческим сигналам уже после индексации.
Узнать подробнее о том, как ТекстЗавод защищает тексты от галлюцинаций — на textzavod.ru. Там же можно создать профиль своей компании и посмотреть на качество генерации в вашей нише.