1. Ana Sayfa
  2. API
  3. Google Cloud Text to Speech API Hakkında Bilmeniz Gerekenler
Updated on API

Google Cloud Text to Speech API Hakkında Bilmeniz Gerekenler

Cliff Weitzman

Cliff Weitzman

Speechify'in CEO'su ve Kurucusu

Speechify API; 300 ms gecikme, insan kalitesinde sesler ve 50+ dil sunar

apple logo2025 Apple Tasarım Ödülü
50M+ Kullanıcı

Üretici yapay zeka ve yapay zeka son yıllarda çok gelişti. Metinden sese aslında epey eski bir kavram ve uzun süredir kullanılıyor. Burada anlatılacak ve sınıflandırılacak çok şey var; hepsini toparlayıp farklı açılardan ele alacağım. İster yeni başlıyor olun ister profesyonel olun, Google Metinden Sese API’sine dair net bir genel bakış sunacak.

Detaylara dalmadan önce bazı temel noktaları netleştirelim. Birkaç terimi açıklayıp üzerine rahatça devam edebileceğimiz sağlam bir temel kuralım.

Önce iki teknolojiyi net biçimde ayıralım; metinden sese ve API’lara, ardından da Google Cloud’un rolüne bakalım.

Editörün notu: En iyi metinden sese API’sini mi arıyorsunuz? Speechify’ın zengin dokümantasyona sahip ve kullanımı kolay metinden sese API’sine göz atın.

Metinden Sese

Bu konuda çok yazdım; şu Metinden Sese Nedir? blogumu ve ayrıca konuşma sentezi yazılarımı okuyabilirsin. Bunlar daha derine iniyor. Şimdilik pas geçebilirsin, burada birkaç cümleyle özetleyeceğim.

Metinden sese, yazıyı yapay zeka ile üretilen konuşmaya çeviren konuşma sentezi teknolojisine dayanır. Kullanım alanı oldukça geniştir. Disleksi veya görme sorunu yaşayanlara destek olmaktan, verimliliğini artırmak isteyenlere kadar birçok kişiye fayda sağlar.

API

API, Uygulama Programlama Arayüzü demektir. Kısaca, iki uygulama arasında köprü görevi görür. Sesli içerik gereken bir uygulama geliştiriyorsanız ve metinden sese fonksiyonuna ihtiyacınız varsa, metinden sese özelliğini kendiniz geliştirebilir ya da mevcut bir metinden sese API’sine bağlanabilirsiniz.

Uygulamanızı geliştirirken, metinden sese özelliği için üçüncü parti bir API’yı aracı katman olarak kullanabilirsiniz.

Google Cloud API

İşte burada Google Cloud devreye giriyor. Google, güçlü bir metinden sese API’si geliştirdi ve farklı fiyat seçenekleriyle sunuyor. Özel uygulamalar ya da web projeleri geliştiren her yazılımcı, bu ihtiyacı Google’ın TTS (Text to Speech) özellikleriyle rahatça karşılayabilir. Evet, TTS “metinden sese” ifadesinin kısaltmasıdır.

Google Cloud Console’da hızlı başlangıç için https://cloud.google.com/ adresine gidebilirsiniz. Eğitimler, servis hesabı yönetimi ve wavenet seslere erişim gibi imkanlar sunar.

Google Cloud, Google’ın sunduğu bir bulut platformudur ve modüler pek çok servis barındırır. İsterseniz birini, birkaçını ya da hepsini kullanabilirsiniz. Tek yapmanız gereken, her API için kimlik doğrulamada kullanacağınız erişim anahtarlarını oluşturmak. Çoğu servisin belirli bir ücretsiz kullanım sınırı olabilir; ama genel olarak ücretlidir.

Google, 2014 yılında DeepMind’ı metinden sese teknolojisi ve sinir ağı geliştirme konusundaki çalışmaları nedeniyle satın aldı. DeepMind artık Google DeepMind adıyla, aynı çatı altında yer alıyor.

Artık sağlam bir temelimiz olduğuna göre, Google Cloud Metinden Sese API’sine daha detaylı bakalım.

Google Text to Speech API Özellikleri

Google, küresel bir teknoloji lideri. TTS API için, sürekli gelişen birinci sınıf özellikler bekleyebilirsiniz.

Yüksek Kaliteli Ses

Google’ın metinden sese sesleri sektörün en iyileri arasındadır. Gerçek insan sesine çok yakın ve doğal tınlar. TTS hâlâ gelişiyor ve insan gibi konuşan sesi üretebilen kazanacak.

Ses Seçenekleri

Google’ın sunduğu geniş ses yelpazesi sayesinde, projeniz 1000 başka uygulamadan veya rakiplerinizden rahatça ayrışacak.

Kendi Sesini Oluştur

Bu, ses klonlama teknolojisine oldukça yakın. Kendinizi veya bir başkasını (izniyle) kaydedip kişiselleştirilmiş bir ses profili oluşturabilirsiniz. Metninizi bu örnek sesle okutabilirsiniz.

Nöral Sesler

Nöral sesler, en yüksek kaliteyi sunan seçeneklerdir. Uluslararası bir kitleye hitap etmek için farklı dilleri de destekleyebilirsiniz.

Stüdyo Sesleri

Stüdyo sesleri, en üst düzey profesyonel seslerdir ve sanki klasik yöntemle kaydedilmiş gibi son derece kaliteli duyulur.

Ses Ayarı

Bir ses seçin ve hız, ton gibi ayarları değiştirerek sesi dilediğiniz gibi kişiselleştirin.

Google Text to Speech API’nin Fiyatı Ne Kadar?

Her şey ses kalitesine ve metin uzunluğuna bağlı. Sesin insan sesi kadar doğal olmasını isterseniz fiyat yükselir. Yine de, göreceli olarak ücretler düşük kalır ve kaliteli sesler bile oldukça uygundur.

Ses türüAylık ücretsizÜcretsiz kullanımdan sonra
Nöral2 sesler0-1 milyon byte1 milyon byte başına $16
Çok dilli sesler0-1 milyon byte1 milyon byte başına $16
Stüdyo sesleri0-100.000 byte1 milyon byte başına $160
Standart sesler0-4 milyon karakter1 milyon karakter başına $4
Wavenet sesler0-1 milyon karakter1 milyon karakter başına $16

Karakter ve Byte Farkı Nedir

Gördüğünüz gibi, fiyatlandırma ses kalitesine göre ciddi biçimde değişiyor. Metni sese çevirmek için gereken kodlama ve işlem katmanı, paketlere göre farklılık gösteriyor. Standart Seslerde ücretlendirme karakter başına yapılır ve daha ekonomiktir.

Örneğin, projenizde 4 milyon karakter varsa, bunu Standart Seslerle sese çevirmek size yaklaşık $16’a mal olur.

Stüdyo sesleri ise daha fazla işlem gücü gerektirir ve byte bazında ücretlendirilir. Japonca gibi dillerde bir karakter birden fazla byte tutabilir.

En doğru fiyat hesabı için, çalıştığınız dili ve ortalama karakter/byte oranını bilmek önemlidir. Böylece isabetli bir tahmin yapabilirsiniz.

Google Cloud Platform Metinden Sese API Projenizi Nasıl Kurarsınız?

  1. Google Cloud hesabı açın veya bu sayfadan oturum açın
  2. Yeni bir proje oluşturun ve anlamlı bir isim verin
  3. Ödeme yöntemi ekleyin. Yalnızca kullandığınız kadar ödersiniz.
  4. Ardından projenizi seçin ve bir ödeme hesabıyla ilişkilendirin.
  5. Text-to-Speech API’sini aktif edin. Sayfanın üst kısmındaki arama kutusuna "speech" yazın.
  6. Sonuçlardan Cloud Text-to-Speech API’sini seçin
  7. Geliştirme ortamınız için kimlik doğrulamasını ayarlayın. Adımlar için Text-to-Speech kimlik doğrulama kurulumuna bakın.

Text-to-Speech’i projenize bağlamadan da deneyebilirsiniz:

  1. TRY THIS API seçeneğine tıklayın.
  2. Projenizle kullanmak için Text-to-Speech API’yi aktifleştirmek üzere ENABLE’a tıklayın.

Daha fazla yardım için Google Cloud Belgelerine göz atabilirsiniz.

Text to Speech API Nasıl Devre Dışı Bırakılır?

Text-to-Speech API’yi devre dışı bırakmak için Google Cloud Platform panosunda "API’lara genel bakışa git" bağlantısına tıklayın. Text-to-Speech API’yi bulun ve üzerine tıklayın, ardından sayfanın üst kısmındaki "DISABLE API" butonunu seçin.

Google Text to Speech API ile Başlayın

Artık projenizi kurduğunuza göre, işe başlamak için komut satırını kullanabilirsiniz.

gcloud init

Yerel kimlik doğrulaması oluşturun

gcloud auth application-default login

Şimdi bir istemci kütüphanesi kurabilirsiniz. Burada örnek olarak Node.js kullanılacak

npm install --save @google-cloud/text-to-speech

Google Cloud Text to Speech API’nin Desteklediği Diller:

  1. Go
  2. Java
  3. Node.js
  4. C++
  5. C#
  6. PHP
  7. Python
  8. Ruby
  9. TypeScript
  10. Terraform
  11. YAML

Google Cloud API Nasıl Çalışır?

Her şey basit bir API çağrısıyla başlar. Metninizi bir transcript (metin) isteğiyle gönderirsiniz, size de konuşma dosyası (ses) olarak döner. Ses, dil gibi özel tercihlerinizi isteğe ekler, ardından metinden sese API’si size ses dosyasını yollar.

Text to speech istemci kütüphanelerini nasıl kurup kullanacağınızı buradan öğrenebilirsiniz. Kod örnekleri Node.js içindir; ancak Python’dan PHP’ye kadar pek çok dil arasından seçim yapabilirsiniz. Size hangisi uygunsa onu kullanın.

const textToSpeech = require('@google-cloud/text-to-speech');
const fs = require('fs');
const util = require('util');

const client = new textToSpeech.TextToSpeechClient();

/**
 * TODO(developer): Uncomment the following lines before running the sample.
 */
// const text = 'Text to synthesize, eg. hello';
// const outputFile = 'Local path to save audio file to, e.g. output.mp3';

const request = {
  input: {text: text},
  voice: {languageCode: 'en-US', ssmlGender: 'FEMALE'},
  audioConfig: {audioEncoding: 'MP3'},
};
const [response] = await client.synthesizeSpeech(request);
const writeFile = util.promisify(fs.writeFile);
await writeFile(outputFile, response.audioContent, 'binary');
console.log(`Audio content written to file: ${outputFile}`);

Hepsi bu. Google Cloud Metinden Sese API’sini kurdunuz ve ilk metin okuma isteğinizi gönderdiniz. Çıktıları OGG’den MP3’e kadar farklı formatlarda alabilirsiniz.

Google Text to Speech API’yi Kullanmanın Bazı Yolları

Google Text to Speech (TTS) API’si, birçok sektörde geniş kullanım alanına sahiptir. Bunlardan bazıları şunlardır:

  1. Görme Engelli Kullanıcılar için Metinden Sese: Uygulamalarda TTS kullanarak yazılı içeriği sese dönüştürür, dijital bilgiyi görme engelliler için erişilebilir hale getirir.
  2. Otomatik Telefon Sistemleri: Müşteri hizmetleri veya bilgi hatlarında doğal sesli yanıtlar ve karşılama sistemleri için TTS kullanılır.
  3. Medya İçeriği için Seslendirme: Videolar, podcast’ler veya diğer medya içerikleri için doğal sesli anlatıcılar oluşturulur.
  4. Çevrilmiş İçerikler için Metinden Sese: Çevrilen metinler sesli okunarak dil öğrenimi, uluslararası iletişim veya çok dilli içerik tüketimi kolaylaştırılır.
  5. Disleksik Kullanıcılara Okuma Desteği: Disleksi veya okuma güçlüğü yaşayan bireyler için metinleri dinleme imkânı sunar.
  6. Uygulamalarda Sesli Navigasyon: Navigasyon uygulamalarında sesli yönlendirme ve konum bilgisi sağlar.
  7. Eğitim İçeriği için Metinden Sese: Eğitim içeriklerini sesli hale getirerek öğrenmeyi ve katılımı artırır.
  8. Verimlilik Uygulamaları için Konuşma Sentezi: Not alma veya yapılacaklar uygulamalarında TTS ile sesli geri bildirim sağlanır.
  9. Sanal Asistanlar için Doğal Ses: Sesli asistanlarda insan gibi konuşan TTS ile daha güçlü bir etkileşim sunulur.
  10. Sesli Uyarı ve Bildirimler: IoT cihazlarda sesli uyarılar, bilgilendirme veya durum güncellemeleriyle kullanıcı farkındalığı artırılır.

Google Cloud TTS API için En İyi Alternatifler

Son bilgilerime göre (Ocak 2022), Google Text to Speech API’ye pek çok alternatif bulunuyor. Bu hizmetlerin popülerliği ve yetenekleri zamanla değişmiş olabilir. İşte öne çıkan bazı alternatifler:

  1. Speechify Text to Speech API: Speechify Text to Speech API 60+ dilde, 1000’den fazla duygusal AI sesleri sunar. Bugün yerinizi ayırtın.
  2. Amazon Polly: Amazon Web Services (AWS) tarafından sunulur. Çeşitli dillerde doğal sesli sentez sağlar ve AWS ekosistemiyle iyi entegre olur.
  3. Microsoft Azure Speech Service: Azure Speech Service, metinden sese yetenekleri sunar ve asistan, navigasyon gibi pek çok senaryoyu destekler.
  4. IBM Watson Text to Speech: IBM Watson, yazılı metni doğal sese dönüştüren hizmetler sağlar.
  5. Nuance Communications: Nuance, sağlık, otomotiv ve müşteri hizmetleri gibi alanlarda metinden sese dahil çeşitli ses teknolojileri sunar.
  6. CereProc: CereProc, erişilebilirlik, eğlence ve iletişim gibi alanlar için yüksek kaliteli metinden sese çözümleri sunar.
  7. iSpeech: iSpeech, çok dilli ve çok sesli bulut tabanlı metinden sese hizmeti sunar. Mobil uygulamalarda ve web sitelerinde kullanılabilir.
  8. ResponsiveVoice: ResponsiveVoice, web uygulamalarında kullanılabilen çok dilli ve uygun fiyatlı bir metinden sese API’sidir.
  9. Neospeech: Neospeech, doğal sesli metinden sese çözümleri sunar; eğitim ve eğlence uygulamalarında kullanılır.
  10. ReadSpeaker: ReadSpeaker, web siteleri, e-eğitim ve erişilebilirlik gibi alanlarda çevrimiçi ve çevrimdışı metinden sese çözümleri sağlar.
  11. Acapelabox: Acapela Group, farklı sektörler için çok dilli sesli metinden sese API’si sunar.

Sıkça Sorulan Sorular

Google’ın sunduğu birçok ses seviyesinde ücretsiz kullanım sınırı vardır. Örneğin standart sesler, ilk 1 milyon byte’a kadar ücretsizdir. Sonrasında 1 milyon byte $16’dır. Yani, belirli karakter/byte limitine kadar ücretsiz kullanılabilir.

Sadece https://cloud.google.com/text-to-speech/ adresinde bir hesap oluşturun ve oradaki adımları izleyin. Ayrıca bu blogda tüm adımları ayrıntılı biçimde anlattım.

Google Cloud hesabınıza giriş yapıp bir proje oluşturun. Proje oluşturduktan sonra API anahtarını da oluşturabilirsiniz.

Google Text to Speech API’nin URL’si https://cloud.google.com/text-to-speech/

Google Cloud için teknik olarak tek bir genel ücretsiz deneme süresi yoktur. İçerdiği her servis için farklı ücretsiz katmanlar ve politikalar bulunur.

Hayır. Google Cloud metinden sese API’si için mutlaka internet bağlantısı gerekir.

Google Cloud servislerine, Text to Speech API dâhil, API anahtarı, OAuth 2.0 veya servis hesabı ile kimlik doğrulaması yapılabilir. Hangi yöntemin seçileceği, uygulama türüne ve ihtiyaca göre değişir.

5 yıldız veririm. Kullanımı kolay, arama özelliği çok iyi ve oldukça pratik. Fiyatı makul ve genel olarak çok başarılı bir ürün.

Google Text to Speech API, Python’un da aralarında olduğu birçok programlama dili için istemci kütüphaneleri sunar. Ayrıca HTTP ile uyumlu diller için RESTful API desteği de bulunur.

Android uygulamasına Google Text to Speech API entegrasyonu için TextToSpeech sınıfı ve API isteklerinden yararlanılır. Ayrıntılı bilgiler Android geliştirici dokümantasyonunda yer alır.

JavaScript uygulamasında Google Text to Speech API kullanmak için API uç noktasına HTTP isteği gönderebilirsiniz. Doğru API isteğini hazırlayıp yanıtı JavaScript kodunuzda işlersiniz. Ayrıntılı bilgi için resmi dokümantasyona bakın.

Speechify’ın çok beğenilen seslerine API ile hızlı, ölçeklenebilir ve geliştirici dostu erişim sağlayın

API Erişimi Al
api access banner

Bu Makaleyi Paylaş

Cliff Weitzman

Cliff Weitzman

Speechify'in CEO'su ve Kurucusu

Cliff Weitzman, disleksi farkındalığı savunucusu ve dünyanın 1 numaralı metinden konuşmaya uygulaması Speechify'ın CEO'su ve kurucusudur. Speechify, 100.000'den fazla 5 yıldızlı yoruma sahip olup App Store'da Haberler & Dergiler kategorisinde birinci sırada yer almaktadır. 2017 yılında, interneti öğrenme güçlüğü yaşayan kişiler için daha erişilebilir kılmaya yönelik çalışmaları nedeniyle Forbes 30 Under 30 listesine seçilmiştir. Cliff Weitzman; EdSurge, Inc., PC Mag, Entrepreneur, Mashable ve diğer önde gelen yayınlarda kendisine yer verilmiştir.

speechify logo

Speechify Hakkında

#1 Metinden Sese Okuyucu

Speechify dünyanın önde gelen metinden sese platformudur. 50 milyondan fazla kişi tarafından kullanılır ve 500.000'den fazla beş yıldızlı yorumla desteklenir; metinden sese iOS, Android, Chrome Eklentisi, web uygulaması ve Mac masaüstü uygulamalarında sunulur. 2025 yılında Apple, Speechify'a prestijli Apple Tasarım ÖdülüWWDC'de vermiş ve onu “insanların hayatlarını yaşamalarına yardımcı olan kritik bir kaynak” olarak nitelendirmiştir. Speechify, 60+ dilde 1.000+ doğal ses seçeneğiyle neredeyse 200 ülkede kullanılmaktadır. Ünlü seslerden bazıları Snoop Dogg ve Gwyneth Paltrow'a aittir. Yaratıcılar ve işletmeler için Speechify Studio gelişmiş araçlar sunar; bunlar arasında Yapay Zeka Ses Üreticisi, Yapay Zeka Ses Klonlama, Yapay Zeka Dublaj ve Yapay Zeka Ses Değiştirici bulunmaktadır. Speechify ayrıca üstün kalitede ve uygun maliyetli metinden sese APIsiyle önde gelen ürünlere güç verir. The Wall Street Journal, CNBC, Forbes, TechCrunch ve diğer önde gelen medya kuruluşlarında yer alan Speechify, dünyanın en büyük metinden sese sağlayıcısıdır. Daha fazla bilgi için speechify.com/news, speechify.com/blog ve speechify.com/press adreslerini ziyaret edin.