أجهزة تحويل النص إلى كلام (TTS) منتشرة جداً وتتعدد أشكالها. لكن هل كل حلول النص إلى كلام تقدم نفس المستوى؟ الكثير من برامج TTS تستطيع قراءة النصوص الرقمية من ملفات وورد، صفحات HTML والمواقع، مستندات جوجل أو نصوص منسوخة. لكن القليل منها يمكنه تحويل النصوص في الصور أو الملفات المغلقة إلى قراءة طبيعية بصوت واقعي. الحلول المتقدمة تستخدم تقنية التعرف البصري على الحروف (OCR).

ما هو التعرف البصري على الحروف (OCR)؟
OCR، أو التعرف البصري على الحروف، تقنية لاستخراج البيانات من الصور. لها استخدامات عملية وترفيهية عديدة. غالباً تتكوّن من جزء مادي لمسح الصور وجزء برمجي لاستخراج البيانات، والجانب البرمجي هو الأكثر تطوراً. برنامج OCR يستطيع تمييز الحروف والكلمات وترتيبها في جمل، كما يتيح للمستخدم تعديل النص الأصلي المقفل، مثل تحرير ملف PDF يحتوي نصاً غير قابل للتعديل.
كيف يعمل التعرف البصري على الحروف؟
التعرف البصري على الحروف (OCR) تقنية تحول أنواعاً مختلفة من المستندات، مثل الأوراق الممسوحة أو ملفات PDF أو صور الكاميرا، إلى بيانات قابلة للتحرير والبحث. تبدأ العملية بتحليل صورة المستند وتحديد أماكن النص، ثم تقسيمه إلى أسطر وكلمات وحروف. يُقارن كل حرف بأنماط معدّة مسبقاً أو نماذج تعلّم آلي ليتم تحويله إلى نص إلكتروني. بعد التحويل، يمكن تحرير نص الصور والبحث فيه رقمياً.
دمج تحويل النص إلى كلام و OCR
دمج التعرف البصري على الحروف مع النص إلى كلام يقدّم أداة قوية لتحسين سهولة الوصول والإنتاجية. OCR يستخرج النصوص من المستندات والصور والمواد المطبوعة ويحوّلها إلى نص مقروء للآلات. بعدها يمكن إدخال النص إلى نظام TTS ليصبح صوتاً مسموعاً. بهذه الطريقة يمكن لفاقدي البصر الاطلاع على المواد المطبوعة، أو تحويل الكتب والوثائق إلى كتب صوتية، أو الحصول على ترجمة صوتية فورية للنصوص المطبوعة. بدمج OCR مع TTS، يستطيع الجميع التفاعل مع النص بسلاسة أكبر بغض النظر عن قدرتهم على القراءة أو وجود إعاقة بصرية.
استخدامات تحويل نص الصور إلى صوت
دمج تقنيات OCR وTTS يفتح آفاقاً واسعة لجعل المعلومات أسهل للاستماع وللاستهلاك في مواقف كثيرة. إليك بعض استخدامات النص إلى كلام وأجهزة OCR:
- تقنية مساعدة لذوي الإعاقة البصرية: تحوّل النصوص من الكتب أو الوثائق أو الشاشات إلى صوت، لتساعد ذوي الإعاقة البصرية على "قراءة" المحتوى.
- التعليم والتعلم:
- مساعدة لطلاب عسر القراءة: تدعم الطلاب الذين يعانون من عسر القراءة، فرط الحركة أو صعوبات قراءة أخرى بتحويل النص إلى صوت.
- تعلم متعدد الوسائط: يمكن للمتعلمين الاستماع والقراءة معاً لتحسين الفهم والحفظ.
- الترجمة وتعلم اللغات: يحوّل النص المكتوب بلغة أجنبية إلى صوت للمساعدة في النطق والاستيعاب.
- استهلاك المحتوى الرقمي: يحوّل الكتب والمقالات والأخبار إلى كتب صوتية أو بودكاست شخصي.
- إتاحة الوثائق: يقرّب ملفات PDF والمستندات والصور غير القابلة للتعديل من المستخدم عن طريق الصوت.
- تحليل الوثائق التاريخية: يحوّل المخطوطات القديمة والنصوص الأرشيفية إلى محتوى صوتي للباحثين أو المهتمين بالاستماع للنصوص التاريخية.
- الإنتاجية والأعمال: يحوّل التقارير الورقية إلى نص مسموع للمحترفين المشغولين.
- التدقيق اللغوي: يساعد الكتّاب والمحررين في اكتشاف الأخطاء من خلال الاستماع للنص.
- الترفيه: يحوّل القصص المصورة، والروايات المصوّرة وغيرها إلى تجربة صوتية ممتعة.
كيفية قراءة النص من صورة بصوت مرتفع
كثير من مستخدمي أجهزة آبل وأندرويد لا يعلمون أن هواتفهم قد تتضمن تقنية OCR وقارئ نصوص قادر على تحويل بسيط من النص إلى كلام. يمكنك اعتبار ميزات TTS المدمجة تطبيقات مجانية لقراءة النصوص من الكاميرا، رغم أن جودتها أقل من البرامج المتطورة لـ النص إلى كلام. إليك طريقة تفعيل قارئ النص من الصور على أندرويد وآبل:
أندرويد
أجهزة أندرويد بنظام 12 وما بعده مزودة بقارئ نصوص مدمج. أداة مفيدة للتنقل أو قراءة الخطوط الصغيرة، ويمكن الاستفادة منها لقراءة النص من الصور. إليك طريقة تهيئة جهازك:
- ادخل إلى قائمة "إمكانية الوصول" من تطبيق "الإعدادات".
- فعّل خيار "النطق عند التحديد".
- اذهب إلى إعدادات قارئ TTS وفعّل خيار "قراءة النصوص على الصور".
- ارجع إلى الشاشة الرئيسية وافتح تطبيق "الكاميرا".
- وجّه الكاميرا إلى كتاب أو جريدة أو شاشة تعرض نصاً.
- اضغط زر "النطق عند التحديد" قبل اختيار كلمة من الكاميرا.
سيبدأ قارئ نصوص أندرويد في قراءة الكلمة المحددة. يمكنك تحديد جزء أكبر من النص بسحب إصبعك كما في برامج تحرير النصوص.
آبل
لقراءة النصوص المطبوعة بصوت عالٍ على آيفون، يجب أن تتوفر كاميرا تعمل مع iOS 15 أو أحدث، مع تفعيل قارئ TTS المدمج.
- اذهب إلى إعدادات "إمكانية الوصول" من قائمة الإعدادات.
- اضغط على خيار "المحتوى المنطوق".
- فعّل خياري "نطق التحديد" و"نطق الشاشة".
- ارجع إلى الشاشة الرئيسية وشغّل الكاميرا.
- وجّه الكاميرا إلى الصفحة وانتظر ظهور زر "النص الحي" أسفل الشاشة.
- اضغط الزر لتمكين OCR وقراءة الشاشة.
- اسحب للأسفل بإصبعين لبدء القراءة من الأعلى.
- اضغط أو حدد نصاً لقراءته بصوت مسموع.
مثل أجهزة أندرويد، يوفّر الآيباد والآيفون ميزات OCR وTTS لكن بإمكانات محدودة. دقة التعرف على النص جيدة، لكن جودة الصوت لا تزال آلية وتشبه الروبوت.
سبيتشيفاي — أفضل TTS بتقنية OCR
رغم توافر قارئات النصوص وبرامج OCR على الأجهزة المحمولة، إلا أن جودتها وأداءها غالباً متواضعان. لحسن الحظ هناك بديل قوي. سبيتشيفاي هو قارئ نص إلى كلام يجمع بين تقنية OCR وأكثر من 200 صوت ذكاء صناعي طبيعي وعاطفي بأكثر من 60 لغة إضافة إلى أصوات المشاهير. تفوّقه واضح على القرّاء التقليديين؛ إذ يمكنه مسح كتب ووثائق كاملة وتحويل النصوص المطبوعة إلى نص إلكتروني. بعدها يتم توليد قراءة صوتية طبيعية يمكنك ضبط سرعتها كما تشاء. برنامج سبيتشيفاي للنص إلى كلام متوفر للمنصات التالية:
يمكنك تحميله من متجر آبل أو جوجل أو الحصول على نسخة سطح المكتب لنظام ماك أو تثبيت إضافة كروم Chrome Extension. ترخيص واحد يكفي لاستخدام سبيتشيفاي على جميع أجهزتك، سواء كنت تستخدم فايرفوكس، مايكروسوفت، كروم بوك، آبل أو ويندوز. واجهته سهلة الاستخدام لكل الأعمار والخبرات، ومتاح عبر الإنترنت لقراءة فورية.
مصمم خصيصاً لذوي عسر القراءة، وصعوبات القراءة، وضعف البصر، ولمحبي إنجاز مهام متعددة في الوقت نفسه. تقنية المساعدة في Speechify تتفوق على أي قارئ نصوص تقليدي، وهو التطبيق الأمثل لتحويل أي نص رقمي أو مطبوع إلى كتاب صوتي، أو إنشاء بودكاست، وتحسين مهارات القراءة بسرعة وتركيز أعلى. جرّب Speechify مجاناً لتجربة النص إلى كلام وخصّص تجربة قراءة فريدة. كما يتوفر مولّد أصوات بالذكاء الصناعي لتجربة الأصوات فورياً مع أي نص.
الأسئلة الشائعة
ما هو أكثر تحويل نص إلى كلام واقعية؟
سبيتشيفاي يقدّم أكثر من 200 صوت ذكاء صناعي واقعي وبأكثر من 60 لغة ولهجات متنوعة، مما يجعله أكثر طبيعية من المنافسين مثل قارئات نص إلى كلام أخرى كـ Fake You، Nuance، وUberduck.
هل توفر Speechify واجهة برمجة تطبيقات نص إلى كلام؟
نعم، توفر Speechify واجهة برمجة تطبيقات للنص إلى كلام شبيهة بـ واجهة برمجة تطبيقات Google.
كيف أنشئ تعليقاً صوتياً بالذكاء الصناعي؟
يمكن للمستخدمين إنشاء تعليق صوتي بالذكاء الصناعي للأغراض التجارية بسهولة باستخدام ستوديو سبيتشيفاي.
هل يمكنني تحويل الملاحظات إلى بودكاست؟
بميزة البودكاست الذكي في Speechify، يمكنك تحويل أي نص أو ملاحظة مطبوعة إلى بودكاست بالذكاء الصناعي وتحميله كـ ملفات MP3.

