• Ешқандай Нәтиже Табылған Жоқ

Қолданушылардың таңдауы

Этап 6: A н a лиз последствий

4. Қорытынды

Технические науки

138 №6 2020 Вестник КазНИТУ

7-сурет. Командаларға үйрету басталған сәттен 150 с өткеннен кейінгі кері модель сипаттамаларының өзгерісі нысана өзгерісі

8-сурет. Командаларға үйрету аяқталғаннан кейінгі кері модель сипаттамаларының өзгерісі

Кері модель өзгерісін білу үшін үйрету жылдамдығы артады. Команда коды 150 с ішінде үйретіледі, содан кейін кіріс модель кірісі өзгереді. Бұл процесс 30 секунттан артық созылмайды және кері модельдің өзгеруінің әсерін кейін қайтадан көруге болады. Командаларға үйретудің жоғары жылдамдығы қайта үйретугі байланысты ауытқуларға әкеледі.

ҚазҰТЗУ хабаршысы №6 2020 139 командаларға үйрету процесі RMS қателігін азайтады деген қорытынды жасалды. Алайда, үйрету жылдамдығының жоғары болуы (β>>1) тұрақсыздыққа, демек, бақылаудың толық жоғалуына әкеледі.

Алғыс

Жұмыс Қазақстан Республикасы Білім және Ғылым министрлігі, Ғылым комитетінің қаржылық қолдауымен АР № 05132936 «Робототехникалық жүйелердің жасанды көрінісін жасау және зерттеу»

жобасы аясында орындалды.

ӘДЕБИЕТТЕР ТІЗІМІ

[1] LenzA., AndersonS. R., PipeA. G., MelhuishC., Dean P.andPorrillJ., "Cerebellar-Inspired Adaptive Control of a Robot Eye Actuated by Pneumatic Artificial Muscles," in IEEE Transactions on Systems, Man, and Cybernetics, Part B (Cybernetics), vol. 39, no. 6, 2009, pp. 1420-1433.

[2] AndersonS. R., PearsonM. J., PipeA., PrescottT., Dean P.andPorrillJ., "Adaptive Cancelation of Self- Generated Sensory Signals in a Whisking Robot," in IEEE Transactions on Robotics, vol. 26, no. 6, 2010, pp. 1065-1076.

[3] Dean, P., Porrill, J. & Stone, J. V.,“Decorrelation control by the cerebellum achieves oculomotor plant compensation in simulated vestibulo-ocular reflex”. Proceedings. Biological sciences / The Royal Society, 269(1503), pp.1895–904. Available at: http://www.pubmedcentral.nih.gov/articlerender.fcgi?artid=16911 15&tool=pmcentrez&rendertype=abstract [Accessed May 23, 2014].

[4] Shibata, T. andSchaal, S., “Biomimetic gaze stabilization based on feedback-error-learning with nonparametric regression networks”. Neural networks: the official journal of the International Neural Network Society, 14(2), pp.201–

16. Available at: http://www.ncbi.nlm.nih.gov/pubmed/11316234.

[5] Dean, P. Porrill J, Ekerot CF, Jörntell H., “The cerebellar microcircuit as an adaptive filter: experimental and computational evidence”. Nature reviews. Neuroscience, 11(1), 2010, pp.30–43. Available at:

http://www.ncbi.nlm.nih.gov/pubmed/19997115 [Accessed May 23, 2014].

[6] Mussina, A.,Ceccarelli M., Balbayev G.,Neurorobotic investigation into the control of artificial eye movements. Mechanisms and Machine Science. vol. 57, 2018, pp. 211–221.

[7] Nussibaliyeva A., Carbone G., Mussina A., Balbayev G., Study of Artificial Vision on the Adaptive Filter Basis for Implementation in Robotic Systems”. Mechanisms and Machine Science,volume 73, 2019, pp.2319-2328.

[8] Anderson, S.R. and Wilson, E.,Simulink Adaptive Filter Code_TDLs, 2011, [Simulink block and Matlab scripts].

Балбаев Ғ.Қ., Шингисов Б.Т., Жетенбаев Н.Т.

Адаптивный фильтр для робототехнических систем

Резюме. В работе используется простая модель вестибуло-глазного рефлекса с помощью Matlab/Simulink для моделирования окуломоторного растения. Основная задача модели вестибулоокулярный рефлекс преобразование вестибулярных сигнальных моторных команд в окуломоторные установки, иначе говоря, скорости головы в скорость глаза. Также в этой работе подробно рассмотрены модели основной системы вестибулоокулярный рефлекс и как осуществляется адаптивное управление мишенью.

Ключевые слова:Вестибулоокулярный рефлекс, церебральный, адаптивный фильтр, робототехника.

УДК 004.934

K. Bostanbekov, A. Alimova, M. Kanatov, D. Nurseitov (Satbayev university, Almaty, Kazakhstan

E-mail: [email protected])

RECOGNITION OF HANDWRITTEN NAMES OF CITIES USING DEEP NEURAL NETWORKS Abstract The offline handwriting recognition would conduce to automate the business processes of many companies, simplifying the work of human beings. Quite a lot of works have been published on offline handwriting recognition in the Latin alphabet, but there are not works on the methods used for recognition texts in Cyrillic.There are two main approaches to handwriting recognition, namely hidden Markov models (HMM) and artificial neural networks (ANN). The methods proposed in this article are based on ANN. The first model is based on deep convolutional neural networks for feature extraction and a fully connected multilayer perceptron for word classification. The next model under consideration, called SimpleHTR, has layers of a convolutional neural network (CNN) and layers of a recurrent neural network (RNN) for disseminating information through an image. Finally, the Connectionist Temporal Classification (CTC) decoding algorithm is executed, which adduces the text to the final version. Models were learned on the dataset of handwritten city names from Cyrillic words. 21,000 images were collected (42 classes of 500 handwriting samples). To increase the data set for training, 207,438 images from available samples were generated. As a result, two approaches for handwriting recognition were analyzed and the SimpleHTR model showed the best results over all.

Keywords—convolutional neural networks, recurrent neural networks, CNN, RNN, CTC.

Технические науки

140 №6 2020 Вестник КазНИТУ

К.А. Бостанбеков, А.Н. Алимова, М. Канатов, Д.Б.Нурсеитов

(Satbayev university Алматы, Казахстан E-mail: [email protected])

РАСПОЗНАВАНИЕ РУКОПИСНЫХ НАЗВАНИЙ ГОРОДОВС ПОМОЩЬЮ ГЛУБОКИХ НЕЙРОННЫХ СЕТЕЙ

Аннотация Оффлайн распознавание рукописного текста является важной и практической задачей, позволяющей упростить множество бизнес-процессов во всех компаниях. Достаточно много работ было опубликовано по офлайн распознаванию рукописного текста на латинском алфавите, при этом отсутствуют работы по методам, применяемым для текстов на кириллице. Существует два основных подхода к офлайн распознаванию рукописного текста, а именно скрытые марковские модели и искусственные нейронные сети (ИНС). Предлагаемые в данной статье методы основаны на ИНС.

Первая модель основана на глубоких cверточных нейронных сетях для извлечения признаков и полно связного многослойного персептрона для классификации слов. Следующая рассматриваемая модель, называемая SimpleHTR, имеет слои сверточной нейронной сети (CNN) и слои рекуррентной нейронной сети (RNN) для распространения информации через изображение. В конце выполняется алгоритм декодирования Connectionist Temporal Classification (CTC), который приводит текст к окончательному варианту. Модели обучались на датасете рукописных названий городов из кириллических слов. Были собраны 21000 изображений (42 класса по 500 образцов почерка). Для увеличения набора данных для обучения была проведена аугментация, были сгенерированы 207438 изображений из имеющихся образцов. Были проанализированы два подхода, при этом модель SimpleHTR показала лучше результат.

Ключевые слова. сверточные нейронные сети, рекуррентные нейронные сети, CNN, RNN, CTC Введение. На сегодняшний день офлайн распознавание рукописного текста является весьма актуальной задачей [1-3]. Распознавание рукописного текста (HTR) – это автоматический способ расшифровки записей с помощью компьютера. Решение данной проблемы позволило бы автоматизировать бизнес процессы множества компаний. Одним из наглядных примеров могут служить почтовые компании, где остро стоит вопрос сортировки большого объема писем и посылок . Если описывать весь процесс работы конечной системы по распознаванию рукописных адресов письменной корреспонденции с использованием машинного обучения от начала до конца, то он будет состоять из следующих шагов:

- Письма помещаются на движущийся конвейер лицевой стороной вверх.

- На определенном участке конвейера делается снимок с определенной периодичностью.

- Система обрабатывает снимок и выдает адреса отправителя и получателя.

- В зависимости от адреса получателя письмо сортируется.

Основные разработки в сфере распознавания рукописного текста для почтовой корреспонденции направлены в основном на решение проблем определения интересующей области, сегментации текста, избавления от мешающих работе с текстом фоновых шумов, таких как утраченные или неясные фрагменты, пятна на бумаге, обнаружение перекоса, а также на обучение искусственного интеллекта, для распознавания написанного текста на интересующем нас языке. Однако на сегодняшний день нерешенных прикладных и теоретических проблем значительно больше, чем полученных решений [4].

Весь путь от отсканированного документа до получения оцифрованного текста состоит из нескольких шагов обработки изображении. Данная процедура может быть разделена на следующие шаги:

1. Предобработка входных картинок (устранение шума, выравнивание по горизонтали). В данном шаге в качестве входных данных подается необработанная картинка. Здесь устраняются шумы, а также оценивается угол поворота объекта вокруг оси, перпендикулярной плоскости.

2. Сегментация региона с текстом по словам. На данном этапе работы определяются рукописные слова и вырезаются в прямоугольные области с текстом для дальнейшего распознавания.

3. Распознавание слова. После того, как сегментация картинки на отдельные регионы слов прошла успешно, можно начать непосредственное распознавание слов.

В данной статье рассматриваются две основные модели, основанные на искусственных нейронных сетях (ANN). Распознавание рукописных слов происходит с использованием Deep Convolutional Neural Networks [5] и модели SimpleHTR [6].

ҚазҰТЗУ хабаршысы №6 2020 141 Модели обучались на датасете рукописных названий городов из кириллических слов. Были собраны 21000 изображений (42 класса по 500 образцов почерка). Для увеличения набора данных для обучения была проведена аугментация, были сгенерированы 207438 изображений из имеющихся образцов [7].

Классификация рукописных слов с использованием Deep Convolutional Neural Networks. В данном эксперименте использовался обычный способ классификации изображений с использованием глубокой сверточной нейронной сети различных моделей. Для правильного распределения данных, были использованы методы предварительной обработки изображения и методы увеличения данных.

Для текущего эксперимента, были выбраны десять классов: Казахстан, Белоруссия, Киргизия, Таджикистан, Узбекистан, Астана, Алматы, Актау, Актобе и Атырау.

Эксперимент состоит из трех вариантов:

− простая модель Сверточной нейронной сети [8],

− MobileNet [9],

− MobileNet с небольшими настройками параметров.

Эксперимент 1

В данном эксперименте использовалась простая модель Сверточной нейронной сети, которая состоит из двух сверточных слоев и слоя softmax [10] для классификации. Такого рода модели часто используются для простых задач, как распознавание символа, классификация животных и так далее.

Входными данными для модели были изображения размером 512х64х1. 10% всего датасета были выделены для оценки модели и не участвовали в процессе обучения. Выходными данными являются 10 значений – вероятности распознавания относительное каждого класса. Процесс обучения состоял из 10 итерации и показалследующие результаты (Рисунок 1):

Рис. 1. Результаты первого эксперимента: слева точность модели, справа ошибка модели

Как видно из рисунка 1, модель после первой итерации уходит в состояние переобучения, где на данных обучения результаты быстро улучшаются и на тестовых данных наоборот ухудшаются. Это значит, что данная модель не справляется с текущим набором данных и не подходит для решения этой задачи. В связи с этим было решено произвести аналогичный эксперимент с более сложными и глубокими слоями нейронной сети.

Эксперимент 2 и 3

Во втором и третьем экспериментах была использована модель, которая называется MobileNet [9]. Данная модель показала хорошие результаты в задаче ImageNet, где решалась задача классификации 1000 объектов. В текущем эксперименте использовалась модель MobileNet уже с обученными сверточными слоями для задач ImageNet. Были заменены слои, которые отвечают за классификацию из 1000 классов в 10 и переобучены заново с использованием подготовленных ранее рукописных данных. Эксперимент 2, как и предыдущий состоял из 10 итераций, и для обучения использовался метод оптимизации Adadelta [11] с начальным шагом обучения learning rate (lr) = 1.0.

На рисунке 2 показаны результаты после 10 итерации обучения и как это видно, модель только после 3-ей итерации начала обучатся правильно. Такое поведение обучения обычно говорит о том, что для метода оптимизации Adadelta начальное значение шага обучения (lr=1.0) очень велик и нужно его

Технические науки

142 №6 2020 Вестник КазНИТУ

уменьшить. Поэтому Эксперимент 3 проводился в точности как Эксперимент 2, только с одним отличием – lr=0.01. Результаты Эксперимента 3 показаны на рисунке 3.

Рис. 2. Результаты второго эксперимента с использованием MobileNet (lr=1.0): слева точность модели, справа ошибка модели

Рис. 3.Результаты третьего эксперимента с использованием MobileNet (lr=0.01): слева точность модели, справа ошибка модели

Из рисунка 3 можно увидеть, что начальные итерации стали более правильными. Однако, в шестой итерации модель показывает большой резонанс относительно всего графика. Причины такого поведения все еще изучается, одно из вероятных причин – это малое количество данных. Для проверки данной гипотезы мы запланировали еще больше увеличить данные методами Аффинной трансформации, растягивания изображения и других искажений, и повторить Эксперимент 3.

Классификация рукописных слов с использованием модели SimpleHTR. Следующим экспериментом в наших исследованиях была система распознавания рукописного текста SimpleHTR, разработанная Харальдом Шейдл [6]. Предлагаемая система использует Искусственную нейронную сеть (ANN), где несколько слоев Сверточной нейронной сети (CNN) обучаются извлекать соответствующие признаки из входного изображения [12-14]. Затем эти слои выводят 1D или 2D карту объектов (или последовательность), которая передается слоям Рекуррентной нейронной сети (RNN).

RNN распространяет информацию через последовательность. После этого выходные данные RNN отображаются на матрицу, которая содержит оценку для каждого символа на элемент последовательности. Для получения окончательного текста к выходу RNN применяется алгоритм декодирования. Декодирование матрицы выполняется с помощью операции временной классификации соединения (Connectionist Temporal Classification – CTC) (Рисунок 4). Для улучшения точности распознавания декодирование может использовать также языковую модель [15].

ҚазҰТЗУ хабаршысы №6 2020 143 Рис. 4. Модель SimpleHTR, где зеленый – операции, а розовый – потоки данных

При обучении с использованием временной классификации соединения (CTC), выход RNN является матрицей, содержащей вероятности символа для каждого временного шага. Алгоритм декодирования CTC преобразует эти символьные вероятности в окончательный текст. Затем для увеличения точности используется алгоритм, которая делает поиск слов в словаре. Однако время прохождения поиска слов зависит от размера словаря и не может декодировать произвольные строки символов, такие как числа.

Операции. CNN: входное изображение подается в слои CNN. Эти слои обучены извлекать соответствующие признаки из входного изображения. Каждый слой состоит из трех операций. Сначала выполняется операция свертки, которая применяет к входу ядро фильтра размером 5×5 в первых двух слоях и 3×3 в последних трех слоях. Затем применяется нелинейная функция RELU. В конце, pooling слой суммирует области изображения и выводит уменьшенную версию ввода. Хотя высота изображения уменьшается на 2 в каждом слое, карты признаков (каналы) добавляются, так что выходная карта признаков (или последовательность) имеет размер 32×256.

RNN: последовательность признаков содержит 256 признаков за временной шаг, RNN распространяет соответствующую информацию через эту последовательность. Используется популярная реализация RNN с длинной кратковременной памятью (LSTM), поскольку она способна распространять информацию на большие расстояния и обеспечивает более надежные характеристики обучения, чем обычная RNN. Выходная последовательность RNN отображается в матрицу размером 32×80. Набор данных состоит из 79 различных символов, далее для операции CTC требуется еще один дополнительный символ (пустая метка CTC), поэтому для каждого из 32 временных шагов имеется 80 записей.

CTC: во время обучения нейронной сети CTC получает выходную матрицу RNN и желаемый текст, и он вычисляет значение потерь. Получая вывод, CTC получает только матрицу и декодирует ее в окончательный текст. Длина основного текста и распознанного текста может быть не более 32 символов.

Данные. Входные данные: это серое изображение размером 128×32. Обычно изображения из набора данных не имеют точно такого размера, поэтому исходный размер меняется (без искажений), пока он не будет иметь ширину 128 или высоту 32. Затем изображение копируется в белое целевое изображение размером 128×32. Этот процесс показан на рисунке 5. Затем, значения серого нормализуются, что упрощает задачу для нейронной сети.

Технические науки

144 №6 2020 Вестник КазНИТУ

Реализация SimpleHTR состоит из 4 модулей:

1. SamplePreprocessor.py: готовит изображения из набора данных IAM для NN.

2. DataLoader.py: считывает образцы, помещает их в пакеты и предоставляет интерфейс итератора для просмотра данных.

3. Model.py: создает модель, как описано выше, загружает и сохраняет модели, управляет сеансами Tensorflow и предоставляет интерфейс для обучения и вывода.

4. main.py: объединяет все ранее упомянутые модули.

Модель SimpleHTR была обучена на собранных данных, где имеются 42 наименований стран и городов с различными образцами почерка. Эти данные были увеличены в 10 раз. Были проведены 2 эксперимента: с выравниванием курсивного написания слов и без выравнивания.

Для того чтобы запустить обучение модели на своих данных были проделаны следующие работы:

1. Подготовлен файл аннотации входных изображений words.txt.

2. Модифицирован файл DataLoader.py для работы с файлом words.txt в кодировке UTF-8 и пути считывания входных изображений.

3. Входные данные были распределены следующим образом: 90% на обучение и 10% на валидацию обученной модели. Из набора данных для обучения 95% используются непосредственно для обучения, и 5% для проверки.

4. После обучения были получены следующие значения на данных валидации в таблице 1.

Таблица 1. Точность распознавания рукописных названий городов с различными алгоритмами декодирования

Алгоритм

декодирования с выравниванием курсива: без выравнивания:

Character error rate Word accuracy: Character error rate Word accuracy:

bestpath 19.134470% 52.555556% 17.979711% 57.111111%

beamsearch 18.994172% 53.333333% 17.731491% 58.333333%

wordbeamsearch 16.382474% 73.555556% 15.788906%. 75.111111%

На рисунке 5 продемонстрировано изображение с названием области, которую подали на вход, а на рисунке 6 можем увидеть распознанное слово “Южно-Казахстанская” с вероятностью 86%.

Рис. 5. Пример изображения

Рис. 6. Результат распознавания текста из рисунка 5

Заключение. В данной работе были рассмотрены две модели распознавания слов, основанные на глубоких cверточных нейронных сетях (DCNN) и модели SimpleHTR, который содержит слои сверточной нейронной сети (CNN), слои рекуррентной нейронной сети (RNN) и алгоритм декодирования Connectionist Temporal Classification (CTC).

Были проведены эксперименты с различными методами машинного обучения и получены следующие результаты на тестовых данных:

1) сверточная нейронная сеть – 55.3%;

ҚазҰТЗУ хабаршысы №6 2020 145 2) рекуррентно-сверточная нейронная сеть SimpleHTR с алгоритмами декодирования bestpath – 57.1%, beamsearch – 58.3% и wordbeamsearch – 75.1%.

Наилучший результат показал wordbeamsearch, который использует словарь слов для окончательной коррекции распознанного текста.

Данная работа выполнена при поддержке грантового финансирования научных проектов КН МОН РК № AP05135175 «Разработка и внедрение системы по распознанию рукописных адресов письменной корреспонденции АО «Казпочта» с использованием машинного обучения».

ЛИТЕРАТУРА

[1] Jeremy M.H., Scott E.H., Kenichiro T. Linking and Messaging from Real Paper in the Paper PDA //

Proceedings of the 12th annual ACM symposium on User interface software and technology. – Asheville, 1999. – P.179- 186.

[2] Jaeger S. Recovering Dynamic Information from Static, Handwritten Word Images: Dissertation zur Erlangung des Doktorgrades / der Albert-Ludwigs-Universitat. – Freiburg im Breisgau, 1998. – 126 p.

[3] Albawi S., Mohammed T.A., Al-Zawi S. Understanding of a Convolutional Neural Network. // The International Conference on Engineering and Technology. – Antalya, 2017. – P.1-6.

[4] Scheidl H. Handwritten text recognition in historical documents: diplomarbeit / Technische Universität Wien.

- Wien, 2018. – 80 p.

[5] Kim Y. Convolutional neural networks for sentence classification. – 2014 // https://arxiv.org/pdf/1408.5882.pdf: 20.05.2019

[6] Howard A.G., Zhu M., Chen B., Kalenichenko D., Wang W., Weyand T., Andreetto M., Adam H.

Mobilenets: Efficient Convolutional Neural Networks for Mobile Vision Applications. – 2017 // https://arxiv.org/pdf/1704.04861.pdf: 25.05.2019

[7] Memisevic R., Zach Ch., Pollefeys M., Hinton G.E. Gated Softmax Classification // Proceedings conference

“Neural Information Processing Systems”. – 2010. –Vol 23. – 9 p. // https://papers.nips.cc/paper/3895-gated-softmax- classification.pdf

[8] Zeiler M.D. ADADELTA: an Adaptive Learning Rate Method. – 2012 // https://arxiv.org/pdf/1212.5701.pdf [9] Graves A. and Schmidhuber J. Offline handwriting recognition with multidimensional recurrent neural networks // Proceedings of the Neural Information Processing Systems Conference. – Vancouver, 2008. – P.545-552.

[10] Kuo C.-C. J. Understanding Convolutional Neural Networks with A Mathematical Model. – 2016 //

https://arxiv.org/pdf/1609.04112.pdf: 25.05.2019

[11] Simard P.Y., Steinkraus D., Platt J.C. Best practices for convolutional neural networks applied to visual document analysis // Proceedings of the Seventh International Conference on Document Analysis and Recognition (ICDAR 2003). – 2003. // http://cognitivemedium.com/assets/rmnist/Simard.pdf: 25.05.2019

[12] Graves A. Fernandez S., Gomez F., Schmidhuber J. Connectionist temporal classification: labelling unsegmented sequence data with recurrent neural networks //Proceedings of the 23rd international conference on Machine learning. – Pittsburgh, 2006. – P. 369-376.

[13] Нурсеитов Д.Б., Бостанбеков К.А., Алимова А.Н. Обзор зарубежных исследований по проблемам распознавания рукописных адресов письменной корреспонденции // Труды XIV Международной научно- практической конференции «Новости научной мысли – 2018». – Чехия, Прага. – 2018 – С.13-19

[14] Нурсеитов Д.Б., Курманходжаев Д.Б., Убайдуллаев Н.М. Модели распознавания рукописных адресов на основе глубокого обучения для сортировки письменной корреспонденции // Материалы XV Международной

научно-практической конференции «Эффективные инструменты современных наук – 2019». – Чехия, 2019.

– С. 40-47

[15]Бостанбеков К.А., Нурсеитов Д.Б., Курманходжаев Д.Б., Алимова А.Н. Генерация синтезированных данных для обучения модели распознавания рукописных текстов // Материалы IV Международной научно- практической конференции «Информатика и прикладная математика», часть 2 Алматы, 2019. С. 247 - 252.

Бостанбеков К.А., Алимова А.Н., Канатов М., Нурсеитов Д.Б.

Терең нейрондық желілерді қолданып қолжазбалық қалалардың атауларын тану

Түйіндеме. Офлайн қолжазбаны тану бұл барлық компаниялардағы көптеген бизнес-процестерді жеңілдететін жедел, маңызды және практикалық міндет болып табылады. Латын алфавитінде офлайн режимінде қолжазбаны тану бойынша көптеген жұмыстар жарияланған, ал кириллицадағы мәтіндерге арналған әдістер жоқ болып тұр. Офлайн қолжазбаны танудың екі негізгі әдісі бар, олар: жасырын Марков модельдері және жасанды нейронды желілері (ЖНЖ). Осы мақалада ұсынылған әдістер ЖНЖ-ге негізделген. Бірінші модель белгілерді шығаруға арналған терең үйірткі нейреонды желілеріне және сөздерді жіктеу үшін толық байланысқан көпқабатты персептронға негізделген. Қарастырылып отырған келесі модель, SimpleHTR деп аталатын, үйірткі нейронды желілі (CNN) қабаттары және рекурентті нейронды желілі (RNN) қабаттары бар, олар кескін арқылы ақпарат тарата алады. Ақырында, Connectionist Temporal Classification (CTC) декодтау алгоритмі орындалады,

Технические науки

146 №6 2020 Вестник КазНИТУ

бұл мәтінді соңғы нұсқаға жеткізеді. Модельдер кириллица сөздерінен алынған қолмен жазылған қала атауларының жиынтығы бойынша оқытылды. 21000 кескін жиналды (қолжазбаның 500 үлгісіндегі 42 класс).

Дайындық жиынтығын арттыру үшін үлкейту жүргізілді, қолда бар үлгілерден 207 438 кескін жасалды. Екі тәсіл талданды, SimpleHTR моделі ең жақсы нәтижені берді.

Түйінді сөздер.үйірткі нейронды желілер, рекурентті нейронды желілер, CNN, RNN, CTC.

УДК 621.979.6.06

E.B. Medvedkov, A.E. Nazymbekova, D.A. Tlevlesova, A.E. Kairbayeva, E.D. Shambulov (Almaty technological university, Almaty, Kazakhstan

[email protected])

WATERMOON PROCESSING DEVICE

Abstract. By analyzing the component design, it is possible to use the data for sizing, fabrication and assembly of the machine. The performance tests of the device were carried out using watermelons loaded into the machine, both peeled and unpeeled.

As indicators of efficiency, the percentage yield of juice, extraction efficiency, and extraction losses were taken into account. The results of the analysis of productivity showed that the type of fruit and the condition of the peel significantly influenced productivity indicators at the 1% significance level. The percentage yield of juice from refined and unrefined watermelon was 89.5 and 89.7%. The extraction efficiency was respectively 96.6% for refined watermelons, and their corresponding crude values were 97.1%. Extraction losses for peeled and unpeeled fruits were 2.9 and 2.6%, respectively.

Key words: fruit, extractor, juice yield, extraction efficiency, extraction losses, juice constant.

Е.Б.Медведков, А.Е.Назымбекова, Д.А.Тлевлесова, А.Е.Қайрбаева, Е.Д.Шамбулов (Алматы технологиялық университеті, Алматы, Қазақстан

[email protected])

ҚАРБЫЗДЫ ӨҢДЕУГЕ АРНАЛҒАН ҚОНДЫРҒЫ

Аңдатпа: Мақалада көрсеткіштерді жабдықтың өлшемдерін анықтау үшін қолдану мүмкіндігін туғызған компоненттер құрылымының сараптамасы келтірілген. Қондырғының өнімділігін сынақтау үшін қарбыздың аршылған және аршылмаған күйі қолданылды.

Тиімділік көрсеткіштері ретінде шырынның пайыздық шығыны, экстракция тиімділігі және экстракция кезіндегі шығын мөлшері ескерілді. Өнімділікті талдау нәтижелері бойынша өнім тұқымы және қабықтың күйі 1%-дық мөлшерде өнімділік көрсеткіштеріне әсер еткен. Аршылған және аршылмаған қарбыздан алынған шырынның пайыздық түсімі 89,5 және 89,7%. Аршылған қарбыздар үшін эктракция тиімділігі сәйкесінше 96,6%, ал аршылмағандар бойынша 97,1%. Аршылған және аршылмаған тұқымдар бойынша экстракция кезіндегі шығын мөлшері сәйкесінше 2,9 және 2,6% құрайды.

Түйін сөздер: экстрактор, шырын шығыны, экстракция тиімділігі, экстракция кезіндегі шығын мөлшері, шырын константасы.

Тұқымның нәрленуін және қорғанысын қамтамасыз ететін негізгі компонент бойынша өнімнің ішкі бөлігі өте құнды. Етті бөлігі жеткілікті түрде су, қант, дәрумендер және тағамдық талшықтардан тұрады, сондықтан тағам өндірісінде негізгі қосымша есебінде кеңінен қолданылады [1].

Шырын алу әдістемесі бойынша әлі де дәстүрлі әдістер қолданылады. Оған жемісті қолмен мацерациялау немесе тазалау, бөлшектеу және пресстеу үдерістері жатқызылады. Бұл әдістер энергошығынды және еңбекті көп талап етеді, сонымен қатар нәтижесі төмен (шырын аз шығады) және гигиеналық емес болып табылады. Сондықтан шырын алудың дәстүрлі әдісі орта және шағын өндіріс орындарында коммерциялық қажеттілікті қанағаттандыра алмайды. Демек, қайта өңдеу үдерісі бойынша сұраныс болғандықтан шырын алуға арналған орта және кіші өлшемді механикалық қондырғыны жасау қажеттілігі туындады [2].

Өнімділікті бағалау, өңдеу және жобалауға қатысы бар өңделген жемістің инженерлік қасиеттері қарастырылған. Бұл қасиеттерге сығымдылық бойынша беріктік, ылғалдылық және тығыздық жатқызылады. Басқа да қарастырылған факторлар ретінде машина компоненттерінің беріктігі,