УДК 004.852

Внедрение машинного обучения в приложение Android

Аман Кульнар Панабековна – доцент кафедры информатики и информационных технологий Актюбинского регионального государственного университета им. К. Жубанова (г. Актобе, Республика Казахстан)

Панабек Бексултан Асылбекович – магистрант Актюбинского регионального государственного университета им. К. Жубанова (г. Актобе, Республика Казахстан)

Аннотация: В статье рассматривается, как применять машинное обучение в Android Studio. В нашем руководстве мы будем использовать API распознавания текста для сканирования и извлечения текста. Мы также покажем, как использовать API обнаружения и отслеживания объектов для идентификации и поиска объектов на изображениях.

Ключевые слова: Android Studio, ML, ML Kit, API.

Разработчики мобильных приложений могут многое выиграть от инновационных преобразований, которые машинное обучение (ML) предлагает по всей отрасли. Это возможно благодаря техническим возможностям мобильных приложений, обеспечивающим более плавный пользовательский интерфейс, опыт и расширение возможностей компаний с помощью важных функций, таких как предоставление точных предложений на основе местоположения или немедленное обнаружение хронических заболеваний.

В наши дни люди хотят, чтобы их опыт был абсолютно персонализированным. Таким образом, недостаточно создать качественное приложение, вы должны даже сделать так, чтобы ваши целевые пользователи оставались с вашим мобильным приложением.

Здесь вам может помочь машинное обучение. Технология машинного обучения может превратить ваше мобильное приложение в представление пользователя.

Существует несколько способов применения машинного обучения в приложении для Android. Наиболее подходящий способ зависит от заданий или задач, которые вы хотите решить с помощью машинного обучения.

ML Kit – это набор API-интерфейсов машинного обучения, которые можно использовать как для Android, так и для iOS. ML Kit позволяет разработчикам легко интегрировать возможности машинного обучения в свои мобильные приложения без глубоких знаний алгоритмов и методов машинного обучения [1]. Вы можете использовать эту библиотеку для выполнения задач машинного обучения, таких как распознавание текста, маркировка изображений, сканирование штрих-кода, перевод текста и многое другое.

Одним из ключевых преимуществ ML Kit является то, что он позволяет разработчикам запускать модели машинного обучения на устройстве, а не отправлять данные на удаленный сервер для обработки. Это особенно полезно в ситуациях, когда требуются результаты в режиме реального времени, поскольку позволяет ускорить обработку данных [2]. Кроме того, запуск моделей на устройстве может помочь повысить конфиденциальность пользовательских данных, так как это уменьшает объем данных, которые необходимо передать на удаленные серверы.

Еще одним большим преимуществом ML Kit является то, что вам не нужно обучать свои собственные модели. Вместо этого доступны предварительно обученные модели, которые уже прошли обучение на больших наборах данных.

Использование предварительно обученных моделей может сэкономить время и ресурсы при разработке приложений машинного обучения. Эта стратегия может помочь быстро настроить и запустить ваше приложение, не требуя большого количества обучающих данных или вычислительных ресурсов [3]. Однако существуют также некоторые потенциальные ограничения на использование предварительно обученных моделей. Например, они могут быть не такими точными или производительными, как модели, обученные для конкретного варианта использования вашего приложения.

Для всех API-интерфейсов ML Kit требуется Android API уровня 19 или выше, поэтому убедитесь, что для параметра minSdkVersion установлено значение не ниже 19. [5] В этом руководстве я буду использовать Android Studio в качестве своей IDE; это делает хорошую работу по организации файлов.

Если вы используете Gradle версии 7.6 или выше, измените свой , включив в него следующие репозитории:settings.gradle

pluginManagement {

repositories {

google()

}

}

dependencyResolutionManagement {

repositories {

google()

}

}

Теперь в вашем файле добавьте следующую зависимость:

app/build.gradledependencies{

implementation 'com.google.android.gms:play-services-mlkit-text-recognition:18.0.2'

implementation 'com.google.mlkit:object-detection:17.0.0'}.

Затем синхронизируйте свой проект с Gradle Files, и он загрузит библиотеку.

Модели машинного обучения загружаются динамически через сервисы Google Play при первом использовании, но вы можете изменить это, чтобы модели загружались при установке приложения. Для этого добавьте в файл следующий код:AndroidManifest.xml

<application> <meta-data android:name = "com.google.mlkit.vision.DEPENDENCIES" android:value = "ocr" /> <</application>

API распознавания текста ML Kit предназначен для распознавания и извлечения текста из изображений или видео на различных языках и в различных форматах.

Одним из наиболее распространенных приложений распознавания текста является оптическое распознавание символов (OCR), которое включает использование алгоритмов машинного обучения для интерпретации текста с изображений или отсканированных документов [4]. OCR можно использовать для автоматического извлечения информации с визитных карточек или отсканированных документов или для преобразования рукописных заметок в цифровой текст.

Учитывая, что мы ранее импортировали библиотеку ML Kit, нам не нужно делать это снова. Я продемонстрирую два варианта сканирования и извлечения текста.

Использование API-интерфейсов ML Kit в режиме реального времени для распознавания текста может быть эффективным и действенным способом добавления мощных возможностей машинного обучения в ваше приложение.

Список литературы

  1. Антонова П. Введение в искусственный интеллект: Теоретические основы СИИ. – LAMBERT Academic Publishing, 2019 – ISBN: 978-6200279170
  2. Suzuki S, Abe K. Topological Structural Analysis of Digitized Binary Images by Border Following // CVGIP. 1985. Vol. 1. P. 32-46.
  3. Аггавал Чару. Нейронные сети и глубокое обучение. – Висьямс, 2020 – ISBN: - 978-5-907203-01-3
  4. Mohammad Abdur Razzaque PhD, Md. Rezaul Karim. Hands-On Deep Learning for IoT: Train neural network models to develop intelligent IoT applications // Packt Publishing, 2019.
  5. AI and Machine Learning for Coders: A Programmer's Guide to Artificial Intelligence, Laurence Moroney, 2020.

Интересная статья? Поделись ей с другими: