Content at Scale
Сервис создан Джастином Макгиллом — предпринимателем с более чем 15-летним опытом в SEO и контент-маркетинге. Благодаря специальным алгоритмам и обучению на базе миллиардов символов реальных текстов, инструмент может точно спрогнозировать наиболее вероятные варианты слов, которые использует ИИ.
Результат проверки отображается по трем показателям — предсказуемость, вероятность и шаблонность. В правом окне отображаются фразы, которые предположительно созданы ботом. Желтая, оранжевая и красная заливки говорят о степени вероятности того, что текст написан с помощью инструментов искусственного интеллекта.
Почему нельзя публиковать сгенерированные тексты
2 — нейросети врут. Точнее, галлюцинируют. Это значит, что они придумывают несуществующие факты и цифры и уверяют, что это правда. Причина простая: в «мозгах» нейросети заложено, что она обязана помогать людям и должна делать это любыми способами. В итоге, когда в ее базе нет ответа на конкретный вопрос, она придумывает ответ, чтобы помочь человеку.
Для примера я попытался найти исследование о вреде компьютерных мышей (я не знал, есть ли такое исследование). И бот его нашел!
Но оказалось, что это исследование «случай-контроль кожевенного производства и мужского бесплодия»
3 — пользователи не любят сгенерированный контент. А теперь следите за руками: нейросети не придумывают контент → они перерабатывают существующий → 80% информации в интернете — это вода → нейросети перерабатывают воду и выдают ее же. Поэтому проблема не в том, что нейросети плохо пишут. А в том, что они перерабатывают сомнительные тексты и создают такие же.
Чтобы не навредить репутации и сайту, контент нужно проверять на ИИ. Для этого есть специальные сервисы, которые анализируют материалы и оценивают вероятность генеренки. Для тестирования таких сервисов я сгенерировал текст про инвестирование через управляющие компании. Проверять буду две версии: полностью сгенерированную и отредактированную вручную.
Как вручную проверить текст на генерацию
Нейронки это хорошо, но человеческий ум — круче. Поэтому лучший способ вычислить генерацию — проанализировать текст самостоятельно и думать как нейронка.
Давайте разберемся на конкретном примере. Только в этот раз — на примере текста про маркетинговый анализ.
Вроде бы текст грамотный, с фактурой и примерами. Но если присмотреться, сразу видно несколько недочетов:
Бот использует странные формулировки. Например, «это как магический кристалл, который показывает, что происходит…». Вряд ли живые специалисты используют такие сравнения.
Бот неправильно использует слова-связки. Слова-связки — это союзы, союзные слова и частицы. Обычно их используют в тексте, чтобы связать предложения между собой и не нарушить плавность повествования. Но если выбрать неправильную связку, плавность повествования нарушится. Например, бот написал: «Маркетинговый анализ помогает принимать верные решения, ведь он позволяет заглянуть…». В русском языке обычно так не говорят.
Бот пишет с большой буквы после двоеточия. По правилам русского языка после двоеточия нужно писать с маленькой буквы, если это не имя нарицательное или прямая речь. Именно эта деталь — любимый прием нейросетей. Они всегда пишут с большой буквы после двоеточия, пока не запретить им этого делать.
- Много много воды и общих фраз — нейросети любят использовать много причастий, деепричастий и отглагольных существительных.
- Много повторов одних и тех же слов, словосочетаний или принципов построения предложений.
- Все новые строки начинаются с отглагольных существительных и заканчиваются двоеточием. Это главный признак того, что текст сгенерирован нейросетью.
- В предложениях нет согласования. Нейросеть может написать: «текст для различных платформ — социальные сети…». Хотя правильно писать «текст для различных платформ — социальных сетей…».
Много много воды и общих фраз — нейросети любят использовать много причастий, деепричастий и отглагольных существительных.
Много повторов одних и тех же слов, словосочетаний или принципов построения предложений.
Все новые строки начинаются с отглагольных существительных и заканчиваются двоеточием. Это главный признак того, что текст сгенерирован нейросетью.
В предложениях нет согласования. Нейросеть может написать: «текст для различных платформ — социальные сети…». Хотя правильно писать «текст для различных платформ — социальных сетей…».
Если тщательно проанализируете текст по ним, с большой вероятностью вычислите нейронный текст.
Чат, где обсуждаем тексты, SEO, нейросети и рост в контентной профессии
А также наша группа «ВКонтакте» — рассказываем про контент и не только. Заходите за практикой и полезными анонсами.
Но это лишь одна сторона медали. Кроме удобства и экономии ресурсов, технологии создают немало проблем. Вызывают недовольство авторов, чьи материалы алгоритмы используют в качестве источников. Подрывают доверие к студентам, копирайтерам, агентствам: появляются сомнения, что тексты писал человек.
Более того, Google хуже ранжирует сайты с низкокачественным контентом, а именно такой чаще всего получается в результате генерации в AI-сервисах.
Чтобы не столкнуться с неприятными последствиями и контролировать качество работы подрядчиков, предлагаем набор инструментов для проверки текста на написание нейросетью.
Бонус: как проверить текст с помощью нейросетей
Еще один вариант проверить текст — показать его нейросети и попросить проанализировать его. Для этого нужно отправить боту текст вместе с таким запросом:
Проанализируй этот текст и скажи, он сгенерирован нейросетью или нет. Принцип, по которому нужно проверить текст:
1) Много много воды и общих фраз — нейросети любят использовать много причастий, деепричастий и отглагольных существительных.
2) Много повторов одних и тех же слов, словосочетаний или принципов построения предложений.
3) Все новые строки начинаются с отглагольных существительных и заканчиваются двоеточием. Это главный признак того, что текст сгенерирован нейросетью.
4) В предложениях нет согласования. Нейросеть может написать: «текст для различных платформ — социальные сети…». Хотя правильно писать «текст для различных платформ — социальных сетей…».
Бот прочитает текст с точки зрения каждого пункта и сделает заключение. Работает способ не всегда, но в целом использовать его можно.
При проверке сгенерированного и отредактированного текста ChatGPT удивил: он предположил, что текст был написан совместно с нейросетью, а потом его отредактировали.
Giant Language Model Test Room
Не самый простой, но довольно подробный инструмент, позволяющий проверить текст на нейросеть. Алгоритм анализирует текст на основе огромной базы данных и выделяет слова в тексте, которые входят в топ-10, топ-100 или топ-1000 предсказуемых слов. Чем больше совпадений, тем выше вероятность того, что текст сгенерирован роботом.
Правда, алгоритм был разработан для текстов стандарта GPT-2, для проверки контента более поздних форматов — GPT-3 ― инструмент не слишком подходит.
GPT-2 Output Detector
Сервис определяет контент, написанный по алгоритмам GPT-2. Достаточно простой инструмент, который определяет процент вероятности написания текста нейросетью.
Алгоритм работает на базе языковой модели RoBERTa — это усовершенствованная версия BERT, которая для предварительного обучения проанализировала 160 ГБ текста и предоставляет довольно точные результаты проверки контента.
Writer
Удобен тем, что можно не только добавить текст, но и указать ссылку на него. Инструмент считывает контент со страницы сайта и выдает результат вероятности написания текста человеком или нейронной сетью. В бесплатной версии можно проверить до 1500 символов.
Тексты большего объема можно обрабатывать с помощью интеграции через API. В этом случае можно проверять до 500 000 слов в месяц.
Особенность этого инструмента проверки текста на ИИ в том, что он изначально способен сам генерировать контент. Таким образом, он использует более углубленные алгоритмы и постоянно совершенствует аналитику текста.
Crossplag
Простой сервис, который работает без регистрации. Устроен просто: загружаете текст объемом до 3000 слов и нажимаете на «Check».
Сервис сканирует текст и ищет детали, которые могут выдать нейронку. А потом дает заключение: текст написан человеком, AI или это микс.
Потом я проверил текст по частям и в первой же проверке Crossplag на 100% посчитал текст сгенерированным. Это был текст, который я не редактировал:
Я пошел дальше и проверил часть этой статьи в Crossplag. И она тоже оказалась сгенерированной, хотя ее я писал руками. Честно!
Вывод — Crossplag нельзя верить. Большие тексты он считает человеческими, а маленькие — сгенерированными.
Но есть и плюс. Я проверил еще один плохо написанный большой текст и нейронка не ошиблась, посчитала его сгенерированным.
Стоимость. Если тоже хотите протестировать сервис, платить не придется. После регистрации дают 10 кредитов на проверку текстов. Но пока что после проверок кредиты не снимаются.
GPTZero
Вычисляет нейросеть: да, но если текст плохо написан. Все, что считает на 50% человеческим и ниже можно считать сгенерированным. А все, что считает сгенерированным на 30% и выше, должно насторожить. Возможно, текст действительно писали с нейронкой.
Сервис работает как и Crossplag: вставляем текст до 5000 символов и нажимаем на «Scan». Через пару секунд появится результат и 3 раздела проверки: «Result», «Deep Scan», «Sources».
На вкладке «Deep Scan» можно проверить, какие именно фрагменты текста сгенерированы нейросетью, а какие слова встречаются чаще остальных. На вкладке «Sources» сервис покажет, с какими референсами совпадает текст.
Полностью сгенерированный текст сервис посчитал на 30% нейросетевым. Уже лучше, чем результат Crossplag.
Ему не понравились некоторые подзаголовки и предложения, которые не были отредактированы.
Ради теста я снова проверил текст, который вы сейчас читаете и он оказался сгенерированным на 26%. Сервису не понравился подзаголовок и вводное слово «точнее».
В общем, на GPTZero нельзя положиться на 100%. Но к нему можно прислушаться и проверить, какие именно части текста он считает сгенерированными.
Стоимость. Бесплатно можно проверить статьи размером до 5000 символов. Чтобы проверить большой текст, придётся оформлять подписку за $15 в месяц.
PR-CY
Это отечественный сервис, который неплохо распознает нейронный текст. Возможно, причина как раз в том, что его учили сканировать тексты на русском языке и поэтому он лучше понимает, как мы пишем.
По стандарту я сначала загрузил в сервис большой сгенерированный текст. Тот сказал, что текст, вероятно, на 43% нейросетевой. И при этом написал, что текст, скорее всего, нейронкой не создан.
Отредактированный текст он тоже посчитал человеческим. Вероятность нейронки — 35%. (Не зря редактировал).
Раз по большим текстам сервис вычислить нейронку не может, проверяю короткие.
Получилось! Короткий сгенерированный текст нейронка на 69% посчитала ненастоящим.
Получается, PR-CY лучше остальных сервисов понимает, где текст полностью сгенерирован, и его заключениям можно верить. Но я человек мнительный, поэтому снова загрузил текст, который вы сейчас читаете. И вот что получилось.
Нейронка не ошиблась и сказала, что текст точно писал человек. Вывод — PR-CY можно доверять, но проверять нужно небольшие фрагменты текста.
Стоимость. После регистрации дают 10 лимитов, которых хватит на проверку около 9 тысяч символов. Докупить лимиты можно за 500 рублей — дадут 1000 штук.
Пока я писал этот текст, протестировал еще десяток AI-детекторов. Но они с задачами не справились и любые тексты считали на 100% человеческими. Поэтому их в подборку не брал, а оставил эти 3. К их заключениям хотя бы можно прислушиваться.
Так ли ужасен искусственный интеллект
С одной стороны, AI-технологии — наши лучшие помощники. Они позволяют масштабировать контент и экономить значительную часть ресурсов. Тренд прочно укрепляется в современном мире и призван облегчить нам жизнь и рутинные процессы в работе.
Искусственный интеллект становится все совершеннее, появляются целые основанные на нем технологии, как, например, AI Overview —функция поиска на основе ИИ, встроенная в Google и генерирующая готовые ответы на запрос. Для создания контента нейросеть тоже используется, но по
следствия внедрения такого текста непредсказуемы. Есть риск просадки позиций сайта в поисковой выдаче, недовольства читателей, а также вероятность получить жалобу на плагиат.
Частые вопросы о проверке текстов на нейросети
Вопрос: Всегда ли сервисы детекции нейросетей дают точный результат?
Ответ: Нет, ни один сервис не гарантирует 100% точности. Результаты могут зависеть от стиля, темы и степени редактирования текста.
Вопрос: Можно ли обмануть детектор, если сильно переписать текст от нейросети?
Ответ: Да, глубокое рерайтинг, добавление личного опыта, фактов и уникальных выводов значительно снижает вероятность обнаружения.
Вопрос: Какой сервис проверки считается одним из самых надежных?
Ответ: Среди популярных — Originality.ai, GPTZero, Content at Scale. Но их точность варьируется в зависимости от модели ИИ.
Вопрос: Почему мой полностью человеческий текст может быть определен как нейросетевой?
Ответ: Из-за формального, «сухого» стиля, шаблонных фраз или высокой структурированности, которая характерна и для некоторых ИИ.
Вопрос: Что важнее: пройти детектор или сделать текст полезным для читателя?
Ответ: Безусловно, полезность для читателя. Текст, который решает проблему, всегда будет в приоритете, даже если он частично создан с помощью ИИ.
Вопрос: Проверяют ли поисковые системы текст на генерацию?
Ответ: Официально Google заявляет, что наказывает за автоматически сгенерированный контент, созданный исключительно для манипуляции поисковой выдачей.
Вопрос: Есть ли бесплатные инструменты для проверки?
Ответ: Да, например, GPTZero, GPT-2 Output Detector, Writer.com предлагают бесплатные проверки с ограничениями по длине текста.
Вопрос: Помогает ли смена нейросети (например, с ChatGPT на Claude) пройти детектор?
Ответ: Не всегда. Многие детекторы обучаются на выходных данных разных моделей, поэтому простая смена ИИ — не панацея.
Вопрос: Что такое «перлин» в тексте и как он помогает?
Ответ: Перлин (perplexity) — это мера «непредсказуемости» текста. Высокий перлин (сложные, неочевидные формулировки) часто характерен для человеческого письма.
Вопрос: Обязательно ли использовать детекторы, если я уверен в авторстве?
Ответ: Рекомендуется, особенно для коммерческого контента. Это превентивная мера и способ убедиться, что ваш стиль не слишком похож на шаблонный.
Краткая памятка: как подготовить текст к проверке на ИИ
- Напишите текст или получите черновик от нейросети.
- Проведите факт-чекинг и добавьте актуальные данные, цифры, имена.
- Добавьте личные мнения, опыт, субъективные оценки и эмоции.
- Внесите элементы сторителлинга: мини-истории, аналогии, примеры из жизни.
- Разбейте монотонные структуры, измените длину и ритм предложений.
- Замените шаблонные вводные фразы («итак», «в заключение», «следует отметить») на более живые.
- Используйте профессиональный сленг или узкоспециальные термины, если это уместно.
- Добавьте риторические вопросы, обращения к читателю.
- Проверьте текст через 2-3 разных детектора (например, GPTZero, Content at Scale, Originality.ai).
- Проанализируйте, какие фрагменты помечены как сгенерированные, и перепишите их вручную.
- Прочитайте текст вслух — неестественные обороты будут заметны.
- Дайте тексту «отлежаться» несколько часов, а затем взгляните свежим взглядом для финальной правки.
- Убедитесь, что текст дает реальную ценность и решает проблему читателя.
- Только после всех этапов публикуйте материал.




























