3D-принтер для печати шрифтом Брайля

nummary

✩✩✩✩✩✩✩
7 Янв 2024
1
0
Здравствуйте, мне задали сделать проект на тему "Принтер Брайля с голосовым управлением "

Главной задачей является разработка программно-аппаратного комплекса, способного в автоматизированном режиме воспринимать речь и по команде переводить ее на бумагу рельефноточечным шрифтом Луи Брайля. Для ознакомления таблица рельефно-точечного русского шрифта.

Вопрос как сделать систему перевода голоса в текст для дальнейшего перевода в шрифт Брайля. Какие компоненты использовать, датчики где найти код, я просто вообще не знаю ардуино.

Можете пожалуйста объяснить принцип как будет осуществляться "голосовой перевод" и как вообще это реализовать.
 

Вложения

Геннадий П

★★★★★★✩
14 Апр 2021
1,969
632
44
В вашем случае перевод голоса в текст это меньшая проблема. Можно взять например Yandex API для распознавания голоса.
Основная проблема - это печать "пупырышками" на бумаге.
И да, ардуины тут будет мало.

Где это вам такой сложный проект задали?
 

Геннадий П

★★★★★★✩
14 Апр 2021
1,969
632
44
Я думал это максимум где то в качестве дипломной работы, а тут школьникам. Не жирно ли им?

А автору я бы порекомендовал почитать например тут: Yandex SpeechKit | Yandex Cloud - Документация
И да, в оффлайне вы мало что сделаете в плане распознавания. Можно поставить полноценную малину и попробовать на ней что нть сделать.
И я до сих пор не понимаю, зачем принтеру голосовое управление.
 
  • Лойс +1
Реакции: Boroda22

PiratFox

★★★★★✩✩
13 Фев 2020
1,706
474
@Геннадий П, так Московская олимпиада же. Наверное, в Бауманку или МФТИ студентов присматривают. :LOL:

UPD:
в оффлайне вы мало что сделаете в плане распознавания.
Ну почему же. Помнится, в нулевых был у меня телефон Nokia 6280. Так на нём голосовое распознавание имён в телефонной книге работало с достоверностью процентов 80. И это на той элементной базе. Малина, думаю, справится ещё лучше.
 
Изменено:

rkit

★★★✩✩✩✩
5 Фев 2021
508
127
Так на нём голосовое распознавание имён в телефонной книге работало с достоверностью процентов 80
Это поиск по словарю, причем небольшому. Достаточно распознать где-то 30% звуков, чтобы угадать. Для этого принтера надо 99%+ распознавание. Что не проблема на сегодня, на самом деле, просто сильно другой класс задачи.
 

PiratFox

★★★★★✩✩
13 Фев 2020
1,706
474
Это поиск по словарю, причем небольшому.
Ошибаетесь и вот почему: в телефонную книгу можно было записать текстом любые слова в поля имён, и распознавание этих записей было в большинстве случаев удачным, причём на любом языке. Правда, требовалось чёткое произношение и отсутствие заметных шумов. Думаю, что там имело место распознавание фонем, а не слов целиком. А учитывая то, что в той модели телефона(не смартфона!) было не более 25Мб памяти вообще на всё, то никакие словари туда просто не влезли бы.
 
Изменено:

Геннадий П

★★★★★★✩
14 Апр 2021
1,969
632
44
Помнится, в нулевых был у меня телефон Nokia 6280. Так на нём голосовое распознавание имён в телефонной книге работало с достоверностью процентов 80. И это на той элементной базе.
Это, как написали выше, хорошо работает по словарю, угадывая примерно небольшую часть звуков. Это хорошо работало еще до бума нейросетей. Сейчас же, чтобы хорошо распознавать голос независимо от интонации и переводить его в текст нужно использовать нейросеть. А если нужен хороший результат, то две, вторая из которых проверяет результат на корректность, это называется генеративно-состязательная сеть. И для этого нужны неплохие мощности.

Думаю, что там имело место распознавание фонем, а не слов целиком. А учитывая то, что в той модели телефона(не смартфона!) было не более 25Мб памяти вообще на всё, то никакие словари туда просто не влезли бы.
Если бы было распознавание фоном, то заряд аккумулятора улетал бы быстро. Словарь может быть не только исходным текстом, а например идентификаторами похожих звуков, как например слово состоит из звуков, которые и определяются программой.
 

PiratFox

★★★★★✩✩
13 Фев 2020
1,706
474
сли бы было распознавание фоном, то заряд аккумулятора улетыл бы быстро.
ФОНЕМ, а не ФОНОМ. Фонема - это звук, сотавляющая часть слова. Разумеется, в фоновом режиме это не работало, процесс запускался по нажатию кнопки.

Словарь может быть не только исходным текстом, а например идентификаторами похожих звуков,
Вот об этом я и говорю. Только это не словарь, а база слогов-фонем. Их на самом деле немного, но из них можно затем составить любое слово.
 
Изменено:

PiratFox

★★★★★✩✩
13 Фев 2020
1,706
474
@rkit, да ладно. :) А ничего, что телефонная книга изначально пустая? В неё могут вноситься любые слова, причём непредсказуемо. Вот эти-то слова и будут состоять из слогов-фонем, которые затем можно сравнивать с фонемной базой зашитой в ПО телефона. Вы смешиваете понятия. Фонемная база и словарь - вообще разные вещи.
 

rkit

★★★✩✩✩✩
5 Фев 2021
508
127
Я сказал "поиск по словарю". Это конкретная устойчивая задача программирования. Общеизвестный термин.
 

PiratFox

★★★★★✩✩
13 Фев 2020
1,706
474
@rkit, не хочется спорить, но тут применимо понятие "поиск по базе данных". Это тоже "конкретная устойчивая задача программирования" и не менее известный термин. Впрочем, не стоит из ничего устраивать срач, пусть каждый останется при своём мнении. ;)
 

rkit

★★★✩✩✩✩
5 Фев 2021
508
127
База данных это гораздо более широкое понятие, чем словарь. И поиск может быть гораздо более сложный, соответственно.
 

poty

★★★★★★✩
19 Фев 2020
3,230
940
Задачи разные: выбрать наиболее подходящее совпадение из ограниченного размером телефонной книги количества вариантов или распознать одно из многомиллионного набора возможных слов с их множественными формами и правильно их записать.
 

Boroda22

★✩✩✩✩✩✩
23 Фев 2022
251
42
Малинка вполне справится, выше уже кидали ссылки на сервисы, ну на край, можно свою нейронку натренить(мортышкин труд), закодить библу для перевода текста в gcode, сделать чпу станок(3д принтер, но не печатать на бумаге), ничего сложного😁