Этап 4. Центры масс

Это архивная статья, больше не актуальна.

Для создания собственных модулей воспользуйтесь сервисом CapMonster Cloud. Подробную инструкцию можно найти по этой ссылке - Создание пользовательского модуля

Настройка поиска Центров масс - один из самых важных шагов создания модуля распознавания. На каптче центры масс будут выделены точками другого цвета (по умолчанию зелеными). Суть этих точек - места, где будет происходить поиск символа. На этом шаге так же настраивается размер окна распознавания символа.

Основная задача

Необходимо настроить поиск центров масс так, чтобы:

  1. Полученные точки проходили через центры букв или как можно ближе к ним.

  2. Точек было как можно меньше. Но не меньше чем нужно.

  3. Отображающееся время подсчета не должно быть большим.

Правильная настройка

  1. Настройки окна распознавания символа: размер окна должен быть таким, чтобы в него поместился самый большой представитель символов. Кликните на каптчу левой кнопкой мыши и окно распознавания символа будет нарисовано зелёной (цвет по умолчанию) рамкой. Глядя на эту рамку Вы сможете правильно подобрать её размеры.

  2. Настройки размеров области подсчёта массы: увеличивая ширину этой области Вы делаете линию центров масс более плавной. И наоборот. Нужно сделать так, чтобы линия центров масс проходила через центры букв, но не сильно дёргалась в самой букве. Высоту области надо настроить так, чтобы линия на каждой букве была одна.

  3. Порог распознавания: установите порог распознавания так, чтобы линия центра масс стала меньше, но не пропала из центров символов.

  4. Порог символа: не трогайте эту настройку.

  5. Не более одной точки проверки на это прямоугольник: не обязательно искать символ очень часто по ширине, можно это делать раз в две точки, если каптча маленькая или раз в 3-4 точки, если каптча увеличена. По высоте этот параметр должен быть чуть больше самой высокой буквы. А можно и больше, если каптча однострочная. Если добавить слишком много точек, это замедлит скорость распознавания. А если переборщить с разбросом, то будет слишком много ошибок распознавания.

  6. Дополнительные точки: можно добавить точек проверки, с небольшим разбросом по высоте, чтобы лучше искались символы. Так же как и в пункте 5 - если добавить слишком много точек, это замедлит скорость распознавания. А если переборщить с разбросом, то будет слишком много ошибок распознавания.

Разные виды каптч

Каптчи могут быть с очень близко расположенными символами и с отдельно расположенными символами. В первом случае центры масс после правильной настройки будут представлять зелёную линию, проходящую через центры каждого символа. Во втором случае - точки в центрах каждого символа.

Когда ядро распознавания обучено

На этой вкладке можно ещё пощёлкать левой кнопкой мыши (или поводить не отпуская левую кнопку мыши) по каптче и посмотреть отклики ядра в каждом месте каптчи, чтобы лучше понять откуда возникают ошибки распознавания.

Обратите внимание!

При настройке каждого параметра поиска центров масс, желательно пролистывать каптчи и проверять настройки сразу на нескольких вариантах, а не настраивать всё на одной.

Видеоинструкция по ссылке на YouTube.