Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.
Panel
panelIconIdatlassian-info
panelIcon:info:
bgColor#E3FCEF

Пожалуйста, ознакомьтесь с Правилами использования материалов на данном ресурсе

Warning

Это архивная статья, больше не актуальна.

Для создания собственных модулей воспользуйтесь сервисом CapMonster Cloud. Подробную инструкцию можно найти по этой ссылке - Создание пользовательского модуля

После обучения модуля необходимо провести его тестирование.

...

Настройки можно изменять и провести тесты несколько раз, изменение параметров может менять процент распознавания. При этом ядро переучивать не нужно, можно будет просто сохранить модуль.

  1. Количество потоков для тестирования.

  2. Значения фильтра Thresold.

  3. Минимальная дистанция между символами - очень важный параметр! Можно попробовать слегка увеличить или уменьшить. Актуально, если у Вас в ответах много лишних букв (увеличить) или много букв пропущено (уменьшить).

  4. Тип сравнения: полное совпадение = полное соответствие реальному ответу на каптчу, совпадение подстроки и частичное = настройка, которой следует пользоваться, если сайт принимает успешно частичный ответ на каптчу, а не полное соответствие. Тогда Вы можете заставить модуль считать правильными ответы, которые на самом деле только частично верные.

  5. Значение диапазона, если используете подстроку как тип сравнения. Количество верно отгаданных символов подряд, которые мы считаем как успешный ответ на каптчу.

  6. Можно попробовать включить/отключить быстрое распознавание, это тоже может повлиять на процент распознавания.

Вспомним ещё раз типы ошибок распознавания символа

Прежде чем перейти к ошибкам распознавания каптч, давайте вспомним, какие бывают ошибки распознавания символов:

  1. Неправильное распознавание - это когда символ, действительно есть, но распознаётся он не правильно. Например, мы показываем модулю символ «а», а он находит там символ «с».

  2. Пропуск символа - это когда символ есть, но модуль вообще не видит никакого символа, т.е. мы показываем ему символ «а», а модуль выдаёт, что тут ничего нет.

  3. Ложное срабатывание - это когда символа нет, например, между двумя символами, но модуль там что-то находит.

Улучшение распознавания

По сути, вся работа по улучшению процента распознавания у Вашего модуля сводится к балансу этих трёх видов ошибок распознавания символа. Т.е. в идеале Ваш модуль должен при неправильном распознавании иногда:

  1. Заменять правильный символ, неправильным. Например, вместо «captcha» выдавать «cagtcha».

  2. Не видеть тот символ, что есть. Например, вместо «captcha» выдавать «cptcha».

  3. Выдавать лишний символ в тексте каптчи. Например, вместо «captcha» выдавать «camptcha».

И каждая из этих ошибок должна встречаться примерно одинаковое количество раз.

...

Внутри выданного модулем текста виден правильный текст, но он прорежен неправильными символами:

  1. Параметр Минимальная дистанция между символами слишком мал.

  2. Слишком много ошибок распознавания символов (3). В разделе обучения написано как уменьшить количество этих ошибок.

  3. Слишком низкий порог принятия символа.

  4. Комбинации 1, 2 и 3.