Этап 4. Центры масс
Пожалуйста, ознакомьтесь с Правилами использования материалов на данном ресурсе
Это архивная статья, больше не актуальна.
Для создания собственных модулей воспользуйтесь сервисом CapMonster Cloud. Подробную инструкцию можно найти по этой ссылке - Создание пользовательского модуля
Настройка поиска Центров масс - один из самых важных шагов создания модуля распознавания. На каптче центры масс будут выделены точками другого цвета (по умолчанию зелеными). Суть этих точек - места, где будет происходить поиск символа. На этом шаге так же настраивается размер окна распознавания символа.
Основная задача
Необходимо настроить поиск центров масс так, чтобы:
Полученные точки проходили через центры букв или как можно ближе к ним.
Точек было как можно меньше. Но не меньше чем нужно.
Отображающееся время подсчета не должно быть большим.
Правильная настройка
Настройки окна распознавания символа: размер окна должен быть таким, чтобы в него поместился самый большой представитель символов. Кликните на каптчу левой кнопкой мыши и окно распознавания символа будет нарисовано зелёной (цвет по умолчанию) рамкой. Глядя на эту рамку Вы сможете правильно подобрать её размеры.
Настройки размеров области подсчёта массы: увеличивая ширину этой области Вы делаете линию центров масс более плавной. И наоборот. Нужно сделать так, чтобы линия центров масс проходила через центры букв, но не сильно дёргалась в самой букве. Высоту области надо настроить так, чтобы линия на каждой букве была одна.
Порог распознавания: установите порог распознавания так, чтобы линия центра масс стала меньше, но не пропала из центров символов.
Порог символа: не трогайте эту настройку.
Не более одной точки проверки на это прямоугольник: не обязательно искать символ очень часто по ширине, можно это делать раз в две точки, если каптча маленькая или раз в 3-4 точки, если каптча увеличена. По высоте этот параметр должен быть чуть больше самой высокой буквы. А можно и больше, если каптча однострочная. Если добавить слишком много точек, это замедлит скорость распознавания. А если переборщить с разбросом, то будет слишком много ошибок распознавания.
Дополнительные точки: можно добавить точек проверки, с небольшим разбросом по высоте, чтобы лучше искались символы. Так же как и в пункте 5 - если добавить слишком много точек, это замедлит скорость распознавания. А если переборщить с разбросом, то будет слишком много ошибок распознавания.
Разные виды каптч
Каптчи могут быть с очень близко расположенными символами и с отдельно расположенными символами. В первом случае центры масс после правильной настройки будут представлять зелёную линию, проходящую через центры каждого символа. Во втором случае - точки в центрах каждого символа.
Когда ядро распознавания обучено
На этой вкладке можно ещё пощёлкать левой кнопкой мыши (или поводить не отпуская левую кнопку мыши) по каптче и посмотреть отклики ядра в каждом месте каптчи, чтобы лучше понять откуда возникают ошибки распознавания.
Обратите внимание!
При настройке каждого параметра поиска центров масс, желательно пролистывать каптчи и проверять настройки сразу на нескольких вариантах, а не настраивать всё на одной.
Видеоинструкция по ссылке на YouTube.