Уншиж байна ...
ХУУЧИРСАН МЭДЭЭ: 2019/04/08-НД НИЙТЛЭГДСЭН

Хүний яриаг текст болгон хөрвүүлэхэд ТАНЫ ОРОЛЦОО

С.Дэлгэрдалай, ikon.mn
2019 оны 4 сарын 8
iKon.MN
Зураг зураг

Та Монгол хэл дээр дуу хоолойгоороо гар утас, компьютер зэрэг 
цахим төхөөрөмжтэй харилцдаг болмоор байна уу?

Аль болох олон хүн ярьдаг хэлний хувьд тухайн хэл дээрх дуу хоолойгоороо цахим төхөөрөмжтэй харилцах боломж нь том компаниудын (google, apple, amazon, IBM, Microsoft) бүтээгдэхүүнд аль хэдийнэ нэвтэрсэн байдаг. Тэд машинд хүний яриаг ойлгодог болгохын тулд тухайн хэл дээр маш олон хүний өөр өөр орчинд, олон янзын аялгаар уншиж бэлтгэсэн их хэмжээний хаалттай буюу зөвхөн тухайн компани эзэмшдэг дуу хоолойн санг ашигладаг. Эдгээр компанийн хувьд цөөн хүн ярьдаг хэлүүдийг хэзээ системдээ шинээр оруулах нь тодорхойгүй юм. Сүүлийн үед (2012 - одоо) эрчимтэй хөгжиж байгаа Deep learning (AI, Machine learning) технологи нь бидэнд том компаниудыг хүлээхгүйгээр өөрсдөө тэдний бүтээгдэхүүнээс дутахааргүй чанартай яриа таних систем бий болгох боломжийг олгоод байна.

Монгол хэлээр ярьсан яриаг цахим төхөөрөмж таньдаг болоход том хэмжээний дуу хоолойн сан л хэрэгтэй байна гэж ойлгож болно.

Mozilla нь дуу хоолойгоор удирдагддаг програм хангамж хөгжүүлэхийг хүссэн хэн бүхэнд нээлттэй, ямар ч зорилгоор ашиглаж болох дуу хоолойн датасетийг олон нийтийн тусламжтай бий болгох "Common voice" төслийг үүсгэсэн байдаг. Common Voice-д шинэ хэл нэмэхийн тулд хэд хэдэн алхам хийх шаардлагатай.

  1. Эхлээд Common Voice-н вэбсайтыг орчуулсан байх ёстой бөгөөд ингэснээр хүмүүс өөрсдийнхөө эх хэл дээр хувь нэмэр оруулах боломжтой болно.
  2. Дараа нь их хэмжээний зохиогчийн эрхгүй өгүүлбэрүүдийг хүмүүс уншин дуудахаар цуглуулах хэрэгтэй.
  3. Цугларсан өгүүлбэрүүдийг баталгаажуулах.

Эдгээр шаардлагуудыг хангавал тухайн хэл дээрх дуу хоолой цуглуулах боломж Common Voice-ийн вэбсайт дээр бий болдог.

 
Тэгвэл Г.Шаравсамбуу, Э.Төгөлдөр, С.Бадрал, Болорсофт ХХК нь Common Voice вэб сайтыг орчуулан, 6,000 авианы тархац сайтай өгүүлбэр бэлтгэн баталгаажуулж, Common voice дээр Монгол хэлний сургалтын өгөгдлийг олон нийтийн тусламжтай цуглуулах бүрэн боломжтой болгоод байна. Одоо бид дуу хоолойгоо хандивлаж хувь нэмрээ оруулах л үлджээ.

Энэ нь ямар ач тустай вэ?

Common Voice дээр үүсгэгдсэн датасет нь бүрэн нээлттэй буюу дуу хоолойтой холбоотой технологи хөгжүүлэхийг хүссэн судлаачид, IT компаниуд, startup-ууд, хувь хүн гэх мэт хэн бүхэн ашиглаж болох нээлттэй өгөгдөл юм. Хамгийн чухал хэрэглээ болох яриа таних буюу яриаг текст болгон хөрвүүлэх ажилд дутагдалтай байгаа сургалтын өгөгдөл (датасет) бий болох учраас энэ технологийг Монгол хэлээрээ ашигладаг болно. Ингэснээр гар утас, компьютер, гэрийн цахим төхөөрөмжтэйгөө дуу хоолойгоор, ЭХ ХЭЛээрээ харилцах боломжтой болох юм. Нээлттэй дуу хоолойн сантай болсноор энэ төрлийн судалгааны ажлууд илүү олноор хийгдэж эхлэх болно.

Хэрхэн хувь нэмэр оруулах вэ?

1. https://voice.mozilla.org/mn сайт руу ороод "Хувь нэмэр оруулах" хэсэг рүү очно. (Монгол хэл сонгогдоогүй бол баруун дээд буланд байх хэл сонгох хэсгээс Монгол хэлийг сонгоорой)

 

2. "Ярих" хэсгийг сонгосны дараа танд 5 өгүүлбэр бэлтгэн харуулах ба та уншиж дуусаад илгээх товч дарахад л хангалттай.

Энэ мэтээр та өдөрт хэдэн ч удаа дуу хоолойгоо хандивлах боломжтой. Мөн ухаалаг утаснаасаа "Project Common Voice by Mozilla" аппликэйшн суулган дуу хоолойгоо хандивлах боломжтой.

Дуугаа бичүүлэхэд заавал чимээгүй газар хайх шаардлагагүй. Яг л амьдрал дээр байдаг шиг ажил дээрээ, машин дотор, гадаа, гэртээ гэх мэт хаана ч байх боломжтой. Гол нь таны хэлж байгаа зүйл ойлгогдохоор байх нь чухал.

Та "Сонсох" хэсгээс бусад хүмүүсийн илгээсэн дуу хоолойг уншсан өгүүлбэртэй нь тулган баталгаажуулж хувь нэмэр оруулах боломжтой.

Эх хэлээрээ машин, төхөөрөмжүүдтэй ярьж 
харилцдаг болмоор байна уу?

Тэгвэл машиныг Монгол хэл ойлгодог болгоход дуу хоолойгоо хандивлаарай.