Amazon Polly - Developer Guide › it_it › polly › latest › dg › polly-dg.pdf · Amazon...

Amazon PollyDeveloper Guide

Amazon Polly Developer Guide

Amazon Polly: Developer GuideCopyright © 2020 Amazon Web Services, Inc. and/or its affiliates. All rights reserved.

Amazon's trademarks and trade dress may not be used in connection with any product or service that is not Amazon's,in any manner that is likely to cause confusion among customers, or in any manner that disparages or discreditsAmazon. All other trademarks not owned by Amazon are the property of their respective owners, who may or may notbe affiliated with, connected to, or sponsored by Amazon.


Table of ContentsChe cos'è Amazon Polly? .................................................................................................................... 1

Primo utilizzo di Amazon Polly? .................................................................................................... 2Come funziona ................................................................................................................................... 3

Fasi successive .......................................................................................................................... 3Nozioni di base .................................................................................................................................. 4

Fase 1: impostazione di un account e di un utente .......................................................................... 4Fase 1.1: registrazione ad AWS ........................................................................................... 4Fase 1.2: creazione di un utente IAM .................................................................................... 5Fase successiva ................................................................................................................. 5

Fase 2: nozioni di base (console) ................................................................................................. 5Esercizio 1: guida rapida sulla sintesi vocale (console) ............................................................. 6Esercizio 2: sintesi vocale con input di testo normale (console) .................................................. 6Fase successiva ................................................................................................................. 7

Fase 3: nozioni di base (AWS CLI) ............................................................................................... 7Fase 3.1: configurazione diAWS CLI ..................................................................................... 7Fase 3.2: esercizio Nozioni di base ....................................................................................... 9

Esempi di Python ...................................................................................................................... 10Configurazione di Python e test di un esempio (SDK) ............................................................. 10

Voci in Amazon Polly ........................................................................................................................ 12Voci disponibili ......................................................................................................................... 12Voci bilingue ............................................................................................................................ 14

Voci bilingue accentate ...................................................................................................... 14Voci completamente bilingue .............................................................................................. 15

Ascolto delle voci ...................................................................................................................... 16Velocità vocale ......................................................................................................................... 16

Modificare la velocità vocale ............................................................................................... 17Lingue supportate da Amazon Polly ............................................................................................. 18

Tabelle fonemi e visemi per le lingue supportate ................................................................... 19Neural TTS ...................................................................................................................................... 95

Caratteristiche e compatibilità delle regioni ................................................................................... 95Il motore vocale ........................................................................................................................ 96

Scelta del motore vocale (console) ...................................................................................... 96Scelta del motore vocale (CLI) ............................................................................................ 98

Voci neurali .............................................................................................................................. 98Stili di pronuncia NTTS .............................................................................................................. 99

Utilizzo dello stile newscaster ............................................................................................ 100Utilizzo dello stile Conversational ....................................................................................... 101

Contrassegni vocali ......................................................................................................................... 103Tipi di contrassegni vocali ........................................................................................................ 103

Visemi e Amazon Polly .................................................................................................... 103Utilizzo dei contrassegni vocali .................................................................................................. 104

Richiesta di contrassegni vocali ......................................................................................... 104Output dei contrassegni vocali .......................................................................................... 105Esempi di contrassegni vocali ........................................................................................... 106

Richiesta di contrassegni vocali (console) ................................................................................... 107Uso di SSML .................................................................................................................................. 109

Caratteri riservati ..................................................................................................................... 109Utilizzo di SSML nella console .................................................................................................. 111Utilizzo di SSML in AWS CLI .................................................................................................... 112

Utilizzo di SSML con il comando di sintesi vocale ................................................................ 112Sintesi di un documento ottimizzato per SSML .................................................................... 113Utilizzo di SSML per le attività comuni di Amazon Polly ......................................................... 114

Tag SSML supportati ............................................................................................................... 116Identificazione di testo ottimizzato per SSML ....................................................................... 117

iii


Aggiunta di una pausa ..................................................................................................... 118Enfatizzazione delle parole ............................................................................................... 118Impostazione di un'altra lingua per parole specifiche ............................................................. 119Posizionamento di un tag personalizzato nel testo ................................................................ 120Aggiunta di una pausa tra paragrafi ................................................................................... 120Utilizzo della pronuncia fonetica ........................................................................................ 121Controllo di volume, velocità di pronuncia e intonazione ........................................................ 121Impostazione di una durata massima per la sintesi vocale ..................................................... 123Aggiunta di una pausa tra frasi ......................................................................................... 126Controllo sulla pronuncia di tipi speciali di parole ................................................................. 126Pronuncia di acronimi e abbreviazioni ................................................................................ 128Miglioramento della pronuncia specificando le parti del discorso ............................................. 129Aggiunta del suono respiratorio ......................................................................................... 130Stile di pronuncia Conversational ....................................................................................... 132Stile di pronuncia newscaster ............................................................................................ 133Aggiunta della compressione dinamica agli intervalli ............................................................. 133Pronuncia con un tono più morbido ................................................................................... 135Controllo del timbro ......................................................................................................... 135Sussurrare ..................................................................................................................... 136

Gestione dei lessici ......................................................................................................................... 138Applicazione di più lessici ......................................................................................................... 138Gestione di lessici con la console .............................................................................................. 139

Caricamento di lessici con la console ................................................................................. 139Applicazione dei lessici mediante la console (sintesi vocale) .................................................. 140Filtraggio dell'elenco dei lessici con la console ..................................................................... 141Scaricamento di lessici con la console ............................................................................... 141Eliminazione di un lessico con la console ........................................................................... 142

Gestione di lessici con AWS CLI ............................................................................................... 142PutLexicon ..................................................................................................................... 142GetLexicon ..................................................................................................................... 147ListLexicons .................................................................................................................... 147DeleteLexicon ................................................................................................................. 148

Creazione di file audio lunghi ............................................................................................................ 149Impostazione della policy IAM per la sintesi asincrona ................................................................. 149Creazione di file audio lunghi (console) ...................................................................................... 150Creazione di file audio lunghi (CLI) ............................................................................................ 151

Esempi di codice e applicazioni ......................................................................................................... 154Codice di esempio .................................................................................................................. 154

Esempi Java .................................................................................................................. 154Esempi di Python ............................................................................................................ 160

Applicazioni di esempio ............................................................................................................ 165Esempio di Python .......................................................................................................... 165Esempio di Java ............................................................................................................. 174Esempio di iOS ............................................................................................................... 177Esempio di Android ......................................................................................................... 178

Amazon Polly per Windows (SAPI) .................................................................................................... 181Installazione e configurazione di Amazon Polly per Windows (SAPI) ............................................... 181

Creazione di un utente IAM per il client AWS ..................................................................... 181Installazione di AWS CLI per Windows .............................................................................. 182Creazione di un profilo per il client AWS ............................................................................ 182Installazione del plug-in Amazon Polly per Windows ............................................................ 183

Utilizzo di Amazon Polly nelle applicazioni .................................................................................. 183Plugin AWS per WordPress .............................................................................................................. 186

Prerequisiti di installazione ....................................................................................................... 186Creazione di un account AWS .......................................................................................... 186Creazione di un utente IAM .............................................................................................. 186Creazione di un sito Web WordPress ................................................................................. 188

iv


Installazione e configurazione del plugin ..................................................................................... 188Configurazione del plugin ................................................................................................. 189

Personalizzazione di WordPress ................................................................................................ 190Regolazione delle impostazioni di plugin per ottimizzare i file audio ......................................... 190Utilizzare SSML nei contenuti per modificare il modo in cui verrà pronunciato ............................ 190Utilizzo di tag Solo Audio e Solo Parola nei contenuti ........................................................... 190Aggiunta di testo tradotto ai propri post .............................................................................. 191

Amazon Pollycast .................................................................................................................... 192Posizionamento del lettore ................................................................................................ 192

Archivio dei file audio .............................................................................................................. 193Quote ............................................................................................................................................ 194

Regioni supportate .................................................................................................................. 194Throttling ................................................................................................................................ 194Lessici di pronuncia ................................................................................................................. 195Operazioni SynthesizeSpeech dell'API ........................................................................................ 195Operazioni API SpeechSynthesisTask ........................................................................................ 195SSML (Speech Synthesis Markup Language) .............................................................................. 196

Sicurezza ....................................................................................................................................... 197Protezione dei dati .................................................................................................................. 197

Crittografia dei dati inattivi ................................................................................................ 198Crittografia in transito ....................................................................................................... 198Riservatezza del traffico Internet ........................................................................................ 198

Identity and Access Management .............................................................................................. 198Destinatari ...................................................................................................................... 198Autenticazione con identità ............................................................................................... 199Gestione dell'accesso tramite policy ................................................................................... 201Funzionamento di Amazon Polly con IAM ........................................................................... 202Esempi di policy basate su identità .................................................................................... 204Riferimento alle autorizzazioni API Amazon Polly ................................................................. 208

Logging e monitoraggio ............................................................................................................ 209Convalida della conformità ........................................................................................................ 210Resilienza .............................................................................................................................. 210Sicurezza dell'infrastruttura ....................................................................................................... 210Best practice di sicurezza ......................................................................................................... 211

Registrazione di chiamate API Amazon Polly con AWS CloudTrail .......................................................... 212Informazioni di Amazon Polly in CloudTrail .................................................................................. 212Esempio di voci di file di log di Amazon Polly .............................................................................. 213

Integrazione con CloudWatch ............................................................................................................ 215Visualizzazione dei parametri di CloudWatch (console) ................................................................. 215Visualizzazione dei parametri di CloudWatch (CLI) ....................................................................... 215Parametri di Amazon Polly ....................................................................................................... 216Dimensioni per i parametri di Amazon Polly ................................................................................ 217

Riferimento API ............................................................................................................................... 218Actions .................................................................................................................................. 218

DeleteLexicon ................................................................................................................. 219DescribeVoices ............................................................................................................... 221GetLexicon ..................................................................................................................... 224GetSpeechSynthesisTask ................................................................................................. 226ListLexicons .................................................................................................................... 228ListSpeechSynthesisTasks ................................................................................................ 230PutLexicon ..................................................................................................................... 232StartSpeechSynthesisTask ................................................................................................ 234SynthesizeSpeech ........................................................................................................... 240

Data Types ............................................................................................................................ 244Lexicon .......................................................................................................................... 245LexiconAttributes ............................................................................................................. 246LexiconDescription .......................................................................................................... 248

v


SynthesisTask ................................................................................................................ 249Voice ............................................................................................................................. 252

Cronologia dei documenti ................................................................................................................. 254Glossario AWS ............................................................................................................................... 257

vi


Che cos'è Amazon Polly?Amazon Polly è un servizio cloud che converte il testo in voce naturale. Puoi utilizzare Amazon Polly persviluppare applicazioni che aumentano coinvolgimento e accessibilità. Amazon Polly supporta più linguee include una varietà di voci naturali per permettere ai clienti di creare applicazioni abilitate al servizio disintesi vocale che possono essere utilizzate in più località e possono applicare la voce ideale per i propriclienti. Con Amazon Polly, paghi solo il testo sintetizzato. Puoi anche memorizzare nella cache e riprodurrel'audio generato da Amazon Polly senza costi aggiuntivi.

Inoltre, Amazon Polly include una serie di voci Neural Text-to-Speech (NTTS) che offrono miglioramentirivoluzionari nella qualità della sintesi attraverso un nuovo approccio di machine learning, offrendo cosìai clienti le voci di sintesi vocale più naturali e simili a quelle umane. La tecnologia TTS neurale supportaanche uno stile di pronuncia newscaster su misura per i casi d'uso di notiziari.

Tra i casi di utilizzo comuni di Amazon Polly vi sono, a titolo esemplificativo, applicazioni per dispositivimobili, quali lettori di notizie, giochi, piattaforme di eLearning, applicazioni di accessibilità per non vedenti eil settore Internet of Things (IoT), in rapida evoluzione.

Amazon Polly è certificato per l'uso con carichi di lavoro regolamentati per HIPAA (Health InsurancePortability and Accountability Act del 1996) e Payment Card Industry Data Security Standard (PCI DSS).

Alcuni dei vantaggi derivanti dall'utilizzo di Amazon Polly sono:

• Qualità elevata – Amazon Polly offre la nuova tecnologia TTS neurale sia la migliore tecnologia TTSstandard per sintetizzare una voce naturale superiore con un'elevata precisione di pronuncia (tra cuiabbreviazioni, espansione di acronimi, interpretazione di data/ora e disambiguazione di omografi).

• Bassa latenza – Amazon Polly garantisce risposte rapide, che lo rendono la soluzione ideale per i casi

d'uso a bassa latenza come i sistemi di dialogo.

• Supporto per un'ampia gamma di lingue e voci – Amazon Polly supporta decine di voci e lingue, la

maggior parte delle quali dispone di voci maschili e femminili. La tecnologia TTS neurale supportaattualmente tre voci in inglese Regno Unito e otto in inglese Stati Uniti. Questo numero continuerà adaumentare man mano che vengono rese disponibili più voci neurali online. Le voci in inglese Stati Unitidi Matthew e Joanna possono anche utilizzare lo stile neurale newscaster, analogamente a quanto sipotrebbe sentire in un notiziario professionale.

• Convenienza – Il modello di pagamento a consumo di Amazon Polly non prevede costi di installazione.

Puoi iniziare con un numero ridotto di risorse e aumentarle di pari passo con la crescita della tuaapplicazione.

• Soluzione basata su cloud – Le soluzioni TTS installate sui dispositivi richiedono un numero significativo

di risorse di elaborazione, una CPU molto potente e una grande quantità di RAM e spazio su disco.Questi requisiti possono generare costi di sviluppo più elevati e un maggiore consumo energetico sudispositivi, quali tablet, smartphone e così via. Al contrario, quando la conversione TTS si esegue nelcloud AWS, i requisiti di risorse locali si riducono in modo significativo. Ciò consente di utilizzare tuttele lingue e le voci disponibili con la migliore qualità possibile. Inoltre, i miglioramenti relativi alla sintesivocale sono disponibili immediatamente per tutti gli utenti finali e non richiedono nuovi aggiornamenti deidispositivi.

1

Amazon Polly Developer GuidePrimo utilizzo di Amazon Polly?

Primo utilizzo di Amazon Polly?Se utilizzi Amazon Polly per la prima volta, ti consigliamo di consultare le sezioni seguenti nell'ordineindicato:

1. Funzionamento di Amazon Polly (p. 3) – In questa sezione vengono descritti i diversi input e le varieopzioni di Amazon Polly che è possibile utilizzare per creare un'esperienza completa.

2. Nozioni di base su Amazon Polly (p. 4) – In questa sezione puoi impostare il tuo account e provarela sintesi vocale di Amazon Polly.

3. Applicazioni di esempio (p. 165) – In questa sezione vengono forniti ulteriori esempi che puoi utilizzareper esplorare Amazon Polly.

2

Amazon Polly Developer GuideFasi successive

Funzionamento di Amazon PollyAmazon Polly converte testo di input in voce naturale. Puoi chiamare uno dei metodi di sintesi vocale,fornire il testo che vuoi sintetizzare, selezionare una delle voci Neural Text-to-Speech (NTTS) o StandardText-to-Speech (TTS) e specificare un formato di output audio. Amazon Polly sintetizza il testo fornito in unflusso audio vocale di alta qualità.

• Testo di input – Fornisci il testo da sintetizzare e Amazon Polly restituisce un flusso audio. È possibilefornire l'input come testo normale o in formato SSML (Speech Synthesis Markup Language). Con SSMLè possibile controllare diversi aspetti della sintesi restituita, ad esempio pronuncia, volume, intonazione evelocità. Per ulteriori informazioni, consulta Generazione di input vocale da documenti SSML (p. 109).

• Voci disponibili – Amazon Polly offre un portafoglio di lingue e un'ampia gamma di voci, tra cui una voce

bilingue (per inglese e hindi). Per la maggior parte delle lingue, è possibile scegliere tra diverse voci, siamaschili sia femminili. Quando avvii un'attività di sintesi vocale specifichi l'ID voce. Amazon Polly utilizzaquesta voce per eseguire la sintesi vocale. Amazon Pollynon è un servizio di traduzione, la sintesi vocaleviene restituita nella lingua del testo. Tuttavia, se il testo è in una lingua diversa da quella predisposta perla voce, i numeri rappresentati come cifre (ad esempio, 53 e non cinquantatré), vengono sintetizzati nellalingua della voce e non nel testo. Per ulteriori informazioni, consulta Voci in Amazon Polly.

• Formato output – Amazon Polly può restituire la sintesi vocale in più formati. È possibile selezionare il

formato audio più adatto alle proprie esigenze. È possibile ad esempio richiedere la sintesi vocale informato Ogg Vorbis o MP3 da utilizzare in applicazioni Web o per dispositivi mobili oppure richiedere ilformato di output PCM da utilizzare in dispositivi e soluzioni di telefonia AWS IoT.

Fasi successiveSe non hai ancora familiarità con Amazon Polly, ti consigliamo di leggere gli argomenti seguenti nell'ordineindicato:

• Nozioni di base su Amazon Polly (p. 4)• Applicazioni di esempio (p. 165)• Quote in Amazon Polly (p. 194)

3

https://docs.aws.amazon.com/polly/latest/dg/voices-in-polly.html

Amazon Polly Developer GuideFase 1: impostazione di un account e di un utente

Nozioni di base su Amazon PollyAmazon Polly fornisce semplici operazioni dell'API che possono essere integrate facilmente con leapplicazioni esistenti. Per un elenco delle operazioni supportate, consulta Actions (p. 218). Puoi utilizzareuna delle seguenti opzioni:

• SDK AWS – Quando utilizzi gli SDK, le richieste a Amazon Polly vengono automaticamente firmatee autenticate utilizzando le credenziali fornite. Questa è la soluzione consigliata per la creazione diapplicazioni.

• AWS CLI – Puoi utilizzare AWS CLI per accedere a una delle funzionalità di Amazon Polly senza doverscrivere codice.

Nelle sezioni seguenti viene descritto come eseguire l'impostazione e viene fornito un esercizio introduttivo.

Argomenti• Fase 1: impostazione di un account AWS e creazione di un utente (p. 4)• Fase 2: nozioni di base (console) (p. 5)• Fase 3: nozioni di base (AWS CLI) (p. 7)• Esempi di Python (p. 10)

Fase 1: impostazione di un account AWS ecreazione di un utente

Prima di usare Amazon Polly per la prima volta, è necessario completare le seguenti operazioni:

1. Fase 1.1: registrazione ad AWS (p. 4)2. Fase 1.2: creazione di un utente IAM (p. 5)

Fase 1.1: registrazione ad AWSQuando ti registri a Amazon Web Services (AWS), il tuo account AWS viene automaticamente registratoper tutti i servizi AWS, tra cui Amazon Polly. Ti vengono addebitati solo i servizi che utilizzi.

Con Amazon Polly vengono addebitati esclusivamente i costi per le risorse utilizzate. Se sei un nuovocliente AWS, puoi iniziare a utilizzare Amazon Polly gratuitamente. Per ulteriori informazioni, consulta Pianodi utilizzo gratuito AWS.

Se disponi già di un account AWS, passa alla fase successiva. Se non disponi ancora di un account AWS,effettua la procedura seguente per crearne uno.

Per creare un account AWS

1. Aprire https://portal.aws.amazon.com/billing/signup.2. Seguire le istruzioni online.

Come parte della procedura di registrazione riceverai una telefonata, durante la quale dovrai inserireun codice di verifica sulla tastiera del telefono.

Annota l'ID del tuo account AWS perché sarà necessario per eseguire la fase successiva.

4

https://aws.amazon.com/free/

https://aws.amazon.com/free/

https://portal.aws.amazon.com/billing/signup

Amazon Polly Developer GuideFase 1.2: creazione di un utente IAM

Fase 1.2: creazione di un utente IAMI servizi di AWS; ad esempio Amazon Polly, richiedono l'immissione di credenziali di accesso, in modo daconsentire al servizio di stabilire se l'utente dispone delle autorizzazioni per accedere alle risorse presentinel servizio. Per la console è necessaria la password. Per consentire all'account AWS di accedere a AWSCLI o all'API, è possibile creare chiavi di accesso. È sconsigliabile tuttavia accedere ad AWS utilizzandole credenziali dell'account AWS. Consigliamo di utilizzare invece AWS Identity and Access Management(IAM). Crea un utente IAM, aggiungilo a un gruppo IAM con autorizzazioni amministrative, quindi concedile autorizzazioni amministrative all'utente IAM creato. Puoi quindi accedere ad AWS utilizzando un URLspeciale e le credenziali dell'utente IAM.

Se hai effettuato la registrazione ad AWS senza aver creato un utente IAM da utilizzare, puoi crearne unomediante la console di IAM.

Gli esercizi in questa guida richiedono un utente con privilegi di amministratore (adminuser). Per creareun adminuser nel tuo account, utilizza la procedura indicata di seguito.

Creazione di utente amministratore e accesso alla console

1. Crea un utente amministratore chiamato adminuser nel tuo account AWS. Per istruzioni, consultal'articolo relativo alla creazione del primo utente e del primo gruppo di amministratori IAM nella Guidaper l'utente di IAM.

2. Un utente può accedere alla Console di gestione AWS utilizzando un URL speciale. Per ulterioriinformazioni, consulta Modalità di accesso degli utenti al tuo account nella Guida per l'utente di IAM.

Important

Negli esercizi Nozioni di base vengono utilizzate le credenziali di adminuser. Per maggioresicurezza, durante la creazione e il test dell'applicazione di produzione, ti consigliamo di creareun utente amministratore specifico del servizio che disponga delle autorizzazioni solo per leoperazioni di Amazon Polly. Per una policy di esempio che concede le autorizzazioni specifiche diAmazon Polly, consulta Esempio 1: consentire tutte le operazioni Amazon Polly (p. 207).

Per ulteriori informazioni su IAM, consulta:

• AWS Identity and Access Management (IAM)• Nozioni di base• Guida per l'utente di IAM

Fase successivaFase 2: nozioni di base (console) (p. 5)

Fase 2: nozioni di base (console)La console di Amazon Polly rappresenta il modo più semplice per iniziare a provare e utilizzare il servizio disintesi vocale di Amazon Polly. La console di Amazon Polly supporta la sintesi vocale partendo da un testosemplice o da un input SSML.

Argomenti• Esercizio 1: guida rapida sulla sintesi vocale (console) (p. 6)• Esercizio 2: sintesi vocale con input di testo normale (console) (p. 6)

5

https://docs.aws.amazon.com/IAM/latest/UserGuide/getting-started_create-admin-group.html

https://docs.aws.amazon.com/IAM/latest/UserGuide/getting-started_how-users-sign-in.html

https://aws.amazon.com/iam/

https://docs.aws.amazon.com/IAM/latest/UserGuide/getting-started.html

https://docs.aws.amazon.com/IAM/latest/UserGuide/

Amazon Polly Developer GuideEsercizio 1: guida rapida sulla sintesi vocale (console)

• Fase successiva (p. 7)

Esercizio 1: guida rapida sulla sintesi vocale (console)Nell'Avvio Rapido viene descritto il modo più rapido per verificare la qualità del servizio di sintesi vocale diAmazon Polly. Quando selezioni la scheda Text-to-Speech (Sintesi vocale), nel campo di immissione deltesto è già caricato il testo di esempio in modo da consentirti di provare rapidamente Amazon Polly.

Per eseguire rapidamente il test Amazon Polly (console)

1. Accedi alla console di gestione AWS e apri la console Amazon Polly all'indirizzo https://console.aws.amazon.com/polly/.

2. Scegliere la scheda Text-to-Speech (Sintesi vocale).3. Scegliere Plain text (Testo normale).4. In Engine (Motore), scegliere Standard o Neural.5. Scegliere una lingua e la regione AWS, quindi scegliere una voce Se si sceglie Neural per Engine

(Motore), solo l'inglese Stati Uniti è disponibile per la lingua e vengono visualizzate solo le regioni in cuiNTTS è disponibile. Tutte le voci standard sono disabilitate.

6. Scegliere Listen to speech (Ascolta sintesi vocale).

Per eseguire un test più approfondito, consulta gli argomenti seguenti:

• Esercizio 2: sintesi vocale con input di testo normale (console) (p. 6)• Utilizzo di SSML (Console) (p. 111)• Applicazione dei lessici mediante la console (sintesi vocale) (p. 140)

Esercizio 2: sintesi vocale con input di testo normale(console)Nella procedura seguente viene eseguita la sintesi vocale mediante l'inserimento di testo semplice.Osserva come vengono sintetizzati il testo "W3C" e la data "10/3" (3 ottobre).

Per eseguire la sintesi vocale mediante l'inserimento di testo semplice (console)

1. Dopo aver eseguito l'accesso alla console di Amazon Polly, selezionare Get started (Inizia), quindiscegliere la scheda Text-to-Speech (Sintesi vocale).

2. Scegli la scheda Plain text (Testo semplice).3. Digita o incolla questo testo nella casella di input.

He was caught up in the game. In the middle of the 10/3/2014 W3C meetinghe shouted, "Score!" quite loudly.

4. In Engine (Motore), selezionare Standard o Neural.5. Scegliere una lingua e la regione AWS, quindi scegliere una voce Se si sceglie Neural per Engine

(Motore), solo l'inglese Stati Uniti è disponibile per la lingua e vengono visualizzate solo le regioni in cuiNTTS è disponibile. Tutte le voci standard sono disabilitate.

6. Per ascoltare immediatamente la sintesi vocale, scegli Listen to speech (Ascolta sintesi vocale).7. Per salvare la sintesi vocale in un file, esegui una delle operazioni seguenti:

a. Scegli Save speech to MP3 (Salva sintesi vocale su MP3).

6

https://console.aws.amazon.com/polly/


Amazon Polly Developer GuideFase successiva

b. Per impostare un formato di file diverso, seleziona Change file format (Modifica formato di file),scegli il formato di file desiderato e quindi Change (Modifica).

Per esempi più dettagliati, consulta gli argomenti seguenti:

• Applicazione dei lessici mediante la console (sintesi vocale) (p. 140)• Utilizzo di SSML (Console) (p. 111)

Fase successivaFase 3: nozioni di base (AWS CLI) (p. 7)

Fase 3: nozioni di base (AWS CLI)Puoi eseguire praticamente tutte le operazioni Amazon Polly che puoi effettuare utilizzando la consoleAmazon Polly con l'AWS Command Line Interface (AWS CLI). Non puoi ascoltare la sintesi vocaleutilizzando l'AWS CLI. Al contrario, devi salvarla in un file e quindi aprire il file in un'applicazione in grado diriprodurlo.

Argomenti• Fase 3.1: configurazione di AWS Command Line Interface (AWS CLI) (p. 7)• Fase 3.2: esercizio Nozioni di base sull'uso di AWS CLI (p. 9)

Fase 3.1: configurazione di AWS Command LineInterface (AWS CLI)Segui la procedura per scaricare e configurare AWS CLI.

Important

Non è necessaria l'AWS CLI per eseguire le fasi descritte in questo esercizio. Tuttavia, alcuni degliesercizi di questa guida utilizzano AWS CLI. Puoi ignorare questa fase, passare alla Fase 3.2:esercizio Nozioni di base sull'uso di AWS CLI (p. 9) e configurare AWS CLI più tardi quando ènecessario.

Per configurare AWS CLI

1. Scarica e configura AWS CLI. Per istruzioni, consulta i seguenti argomenti nella Guida per l'utente diAWS Command Line Interface:

• Come configurare l'AWS Command Line Interface• Configurazione di AWS Command Line Interface

2. Aggiungi un profilo denominato per l'utente amministratore nel file di configurazione di AWS CLI.Puoi usare questo profilo quando esegui i comandi dell'AWS CLI. Per ulteriori informazioni, consultal'articolo relativo ai profili denominati nella Guida per l'utente di AWS Command Line Interface.

[profile adminuser] aws_access_key_id = adminuser access key ID aws_secret_access_key = adminuser secret access key region = aws-region

7

https://docs.aws.amazon.com/cli/latest/userguide/cli-chap-getting-set-up.html

https://docs.aws.amazon.com/cli/latest/userguide/cli-chap-getting-started.html

https://docs.aws.amazon.com/cli/latest/userguide/cli-chap-getting-started.html#cli-multiple-profiles

Amazon Polly Developer GuideFase 3.1: configurazione diAWS CLI

Per un elenco delle regioni AWS disponibili e delle regioni supportate da Amazon Polly, consultaRegioni ed endpoint nella Riferimenti generali di Amazon Web Services.

Note

Se stai utilizzando la regione supportata da Amazon Polly specificata durante laconfigurazione dell'AWS CLI, puoi omettere la riga riportata di seguito dagli esempi di codicedell'AWS CLI:

--region aws-region

3. Verifica la configurazione digitando il seguente comando help al prompt dei comandi.

aws help

Nella finestra di AWS CLI dovrebbe essere visualizzato un elenco dei comandi AWS validi.

Per abilitare Amazon Polly in AWS CLI (facoltativo)

Se in precedenza hai scaricato e configurato l'AWS CLI, Amazon Polly potrebbe non essere disponibilea meno che non riconfiguri l'AWS CLI. Questa procedura verifica se questa operazione è necessaria efornisce istruzioni se Amazon Polly non è disponibile automaticamente.

1. Verificare la disponibilità di Amazon Polly digitando il seguente comando help al prompt dei comandidell'AWS CLI.

aws polly help

Se una descrizione di Amazon Polly e un elenco di comandi validi sono presenti nella finestra dell'AWSCLI, Amazon Polly è disponibile nell'AWS CLI e può essere utilizzato immediatamente. In questo caso,è possibile ignorare il resto di questa procedura. Se non viene visualizzato, continuare con la Fase 2.

2. Per abilitare Amazon Polly, utilizzare una delle due opzioni seguenti:

a. Disinstalla e reinstalla l'AWS CLI.

Per istruzioni, consulta Installazione dell'AWS Command Line Interface nella Guida per l'utente diAWS Command Line Interface.

oppureb. Scarica il file service-2.json.

Dal prompt dei comandi, eseguire il seguente comando.

aws configure add-model --service-model file://service-2.json --service-name polly

3. Verificare di nuovo la disponibilità di Amazon Polly.

aws polly help

La descrizione di Amazon Polly dovrebbe essere visualizzata.

Fase successivaFase 3.2: esercizio Nozioni di base sull'uso di AWS CLI (p. 9)

8

https://docs.aws.amazon.com/general/latest/gr/rande.html

https://docs.aws.amazon.com/cli/latest/userguide/installing.html

https://github.com/boto/botocore/blob/develop/botocore/data/polly/2016-06-10/service-2.json

Amazon Polly Developer GuideFase 3.2: esercizio Nozioni di base

Fase 3.2: esercizio Nozioni di base sull'uso di AWSCLIOra puoi provare la funzione di sintesi vocale offerta da Amazon Polly. In questo esercizio esegui unachiamata all'operazione SynthesizeSpeech passando il testo di esempio. Puoi salvare l'audio risultantecome un file e verificarne il contenuto.

1. Esegui il comando synthesize-speech di AWS CLI per sintetizzare il testo di esempio in un fileaudio (hello.mp3).

L'esempio seguente di AWS CLI è formattato per Unix, Linux e macOS. Per Windows, sostituisci ilcarattere di continuazione di Unix (la barra rovesciata (\)) in fondo a ciascuna linea con un accentocirconflesso (^) e includi il testo tra doppie virgolette (") e i tag interni tra virgolette singole (').

aws polly synthesize-speech \ --output-format mp3 \ --voice-id Joanna \ --text 'Hello, my name is Joanna. I learned about the W3C on 10/3 of last year.' \ hello.mp3

Nella chiamata a synthesize-speech fornisci il testo di esempio per la sintesi, la voce da utilizzare(fornendo un ID voce, come descritto nella fase 3 seguente) e il formato di output. Il comando consentedi salvare l'audio risultante nel file hello.mp3.

Oltre al file MP3, l'operazione invia il seguente output alla console.

{ "ContentType": "audio/mpeg", "RequestCharacters": "71"}

2. Riproduci il file hello.mp3 risultante per verificare la sintesi vocale.3. Ottieni l'elenco delle voci disponibili eseguendo l'operazione DescribeVoices. Esegui il comando

describe-voices di AWS CLI riportato qui di seguito.

aws polly describe-voices

Come risposta, Amazon Polly restituisce l'elenco di tutte le voci disponibili. Per ogni voce la rispostafornisce i seguenti metadata: ID della voce, codice della lingua, nome della lingua e sesso della voce.Di seguito è riportata una risposta di esempio.

{ "Voices": [ { "Gender": "Female", "Name": "Salli", "LanguageName": "US English", "Id": "Salli", "LanguageCode": "en-US" }, { "Gender": "Female", "Name": "Joanna", "LanguageName": "US English", "Id": "Joanna", "LanguageCode": "en-US" }

9

Amazon Polly Developer GuideEsempi di Python

]}

Facoltativamente, puoi specificare il codice della lingua per trovare le voci disponibili per una linguaspecifica. Amazon Polly supporta decine di voci. L'esempio seguente elenca tutte le voci per ilportoghese brasiliano.

aws polly describe-voices \ --language-code pt-BR

Per un elenco dei codici lingua, consulta Lingue supportate da Amazon Polly (p. 18). Questicodici lingua sono i tag di identificazione della lingua di W3C (codice ISO 639 del nome dellalingua-codice del paese ISO 3166). Ad esempio, en-US (Inglese - Stati Uniti), en-GB (Inglese- Regno Unito), es-ES (Spagnolo) e così via.

Per ottenere l'elenco dei codici della lingua, puoi anche utilizzare l'opzione help in AWS CLI:

aws polly describe-voices help

Esempi di PythonQuesta guida fornisce ulteriori esempi, alcuni dei quali sono esempi di codice Python che utilizzano AWSSDK for Python (Boto) per effettuare chiamate API a Amazon Polly. Ti consigliamo di impostare Python edeseguire il test del codice di esempio fornito nella sezione riportata di seguito. Per ulteriori esempi, consultaApplicazioni di esempio (p. 165).

Configurazione di Python e test di un esempio (SDK)Per eseguire il test del codice di esempio Python, è necessario AWS SDK for Python (Boto). Per istruzioni,consulta SDK AWS per Python (Boto3).

Per testare il codice Python di esempio

Il seguente esempio di codice Python esegue le seguenti operazioni:

• Viene utilizzato AWS SDK for Python (Boto) per inviare una richiesta SynthesizeSpeech a AmazonPolly (specificando testo semplice come input).

• Viene eseguito l'accesso al flusso audio risultante nella risposta e viene salvato l'audio in un file sul discolocale (speech.mp3).

• Viene riprodotto il file audio con il lettore audio di default per il sistema locale.

Salva il codice in un file (example.py) ed eseguilo.

"""Getting Started Example for Python 2.7+/3.3+"""from boto3 import Sessionfrom botocore.exceptions import BotoCoreError, ClientErrorfrom contextlib import closingimport osimport sysimport subprocessfrom tempfile import gettempdir

# Create a client using the credentials and region defined in the [adminuser]# section of the AWS credentials file (~/.aws/credentials).

10

https://aws.amazon.com/sdk-for-python/

Amazon Polly Developer GuideConfigurazione di Python e test di un esempio (SDK)

session = Session(profile_name="adminuser")polly = session.client("polly")

try: # Request speech synthesis response = polly.synthesize_speech(Text="Hello world!", OutputFormat="mp3", VoiceId="Joanna")except (BotoCoreError, ClientError) as error: # The service returned an error, exit gracefully print(error) sys.exit(-1)

# Access the audio stream from the responseif "AudioStream" in response: # Note: Closing the stream is important because the service throttles on the # number of parallel connections. Here we are using contextlib.closing to # ensure the close method of the stream object will be called automatically # at the end of the with statement's scope. with closing(response["AudioStream"]) as stream: output = os.path.join(gettempdir(), "speech.mp3")

try: # Open a file for writing the output as a binary stream with open(output, "wb") as file: file.write(stream.read()) except IOError as error: # Could not write to file, exit gracefully print(error) sys.exit(-1)

else: # The response didn't contain audio data, exit gracefully print("Could not stream audio") sys.exit(-1)

# Play the audio using the platform's default playerif sys.platform == "win32": os.startfile(output)else: # The following works on macOS and Linux. (Darwin = mac, xdg-open = linux). opener = "open" if sys.platform == "darwin" else "xdg-open" subprocess.call([opener, output])

Per ulteriori esempi, inclusa un'applicazione di esempio, consulta Applicazioni di esempio (p. 165).

11

Amazon Polly Developer GuideVoci disponibili

Voci in Amazon PollyVoci disponibili

Amazon Polly offre un'ampia gamma di voci differenti in più lingue per l'uso durante la sintesi vocale.

Lingua Nome/ID Sesso Voce standard Voce neurale

Arabo (arb) Zeina Femmina Sì No

Cinese,mandarino(cmn-CN)

Zhiyu Femmina Sì No

Danese (da-DK)

Naja

Mads

Femmina

Maschio

Sì

Sì

No

No

Olandese (nl-NL)

Lotte

Ruben

Femmina

Maschio

Sì

Sì

No

No

Inglese(Australia) (en-AU)

Nicole

Russell

Femmina

Maschio

Sì

Sì

No

No

Inglese (RegnoUnito) (en-GB)

Amy

Emma

Brian

Femmina

Femmina

Maschio

Sì

Sì

Sì

Sì

Sì

Sì

Inglese (India)(en-IN)

Aditi*

Raveena

Femmina

Femmina

Sì

Sì

No

No

Inglese (StatiUniti) (en-US)

Ivy

Joanna**

Kendra

Kimberly

Salli

Joey

Justin

Kevin

Matthew**

Femmina (bambina)

Femmina

Femmina

Femmina

Femmina

Maschio

Maschio (bambino)

Maschio (bambino)

Maschio

Sì

Sì

Sì

Sì

Sì

Sì

Sì

No

Sì

Sì

Sì

Sì

Sì

Sì

Sì

Sì

Sì

Sì

Inglese (Galles)(en-GB-WLS)

Geraint Maschio Sì No

12

Amazon Polly Developer GuideVoci disponibili


Francese (fr-FR)

Céline/Celine

Léa

Mathieu

Femmina

Femmina

Maschio

Sì

Sì

Sì

No

No

No

Francese(Canada) (fr-CA)

Chantal Femmina Sì No

Tedesco (de-DE)

Marlene

Vicki

Hans

Femmina

Femmina

Maschio

Sì

Sì

Sì

No

No

No

Hindi (hi-IN) Aditi* Femmina Sì No

Islandese (is-IS)

Dóra/Dora

Karl

Femmina

Maschio

Sì

Sì

No

No

Italiano (it-IT) Carla

Bianca

Giorgio

Femmina

Femmina

Maschio

Sì

Sì

Sì

No

No

No

Giapponese(ja-JP)

Mizuki

Takumi

Femmina

Maschio

Sì

Sì

No

No

Coreano (ko-KR)

Seoyeon Femmina Sì No

Norvegese (nb-NO)

Liv Femmina Sì No

Polacco (pl-PL) Ewa

Maja

Jacek

Jan

Femmina

Femmina

Maschio

Maschio

Sì

Sì

Sì

Sì

No

No

No

No

Portoghese(Brasile) (pt-BR)

Camila

Vitória/Vitoria

Ricardo

Femmina

Femmina

Maschio

Sì

Sì

Sì

Sì

No

No

Portoghese(Europa) (pt-PT)

Inês/Ines

Cristiano

Femmina

Maschio

Sì

Sì

No

No

Romeno (ro-RO)

Carmen Femmina Sì No

13

Amazon Polly Developer GuideVoci bilingue


Russo (ru-RU) Tatyana

Maxim

Femmina

Maschio

Sì

Sì

No

No

Spagnolo(europeo) (es-ES)

Conchita

Lucia

Enrique

Femmina

Femmina

Maschio

Sì

Sì

Sì

No

No

No

Spagnolo(Messico) (es-MX)

Mia Femmina Sì No

Spagnolo, StatiUniti (es-US)

Lupe**

Penélope/Penelope

Miguel

Femmina

Femmina

Maschio

Sì

Sì

Sì

Sì

No

No

Svedese (sv-SE)

Astrid Femmina Sì No

Turco (tr-TR) Filiz Femmina Sì No

Gallese (cy-GB)

Gwyneth Femmina Sì No

* Questa voce è bilingue e può parlare inglese e hindi. Per ulteriori informazioni, consulta Vocibilingue (p. 14).

** Queste voci possono essere utilizzate con gli stili di pronuncia Newscaster e Conversationalquando vengono utilizzate con il formato neurale. Per ulteriori informazioni, consulta Stili di pronunciaNTTS (p. 99).

Oltre alle voci di cui sopra, Amazon Polly può costruire un Brand Voice personalizzato che riflette il vostropersonaggio del marchio, fornendo l'opportunità di offrire voci NTTS uniche ed esclusive ai vostri clienti.Per saperne di più su Amazon Polly Brand Voices, consulta https://aws.amazon.com/polly/features/#Brand_Voice.

Voci bilingueAmazon Polly ha due modi per produrre voci bilingue:

• Voci bilingue accentate (p. 14)• Voci completamente bilingue (p. 15)

Voci bilingue accentateLe voci bilingue accentate possono essere create utilizzando qualsiasi voce Amazon Polly, ma solo quandosi utilizzano tag SSML.

14

https://aws.amazon.com/polly/features/#Brand_Voice

https://aws.amazon.com/polly/features/#Brand_Voice

Amazon Polly Developer GuideVoci completamente bilingue

Normalmente, tutte le parole nel testo di input vengono pronunciate nella lingua predefinita della vocespecificata in uso.

Ad esempio, se si sta utilizzando la voce di Joanna che parla inglese (Stati Uniti), Amazon Polly pronunciaquanto segue con la voce di Joanna senza un accento francese:

<speak> Why didn't she just say, 'Je ne parle pas français?'</speak>

In questo caso, le parole Je ne parle pas français sono pronunciate come se fossero in inglese.

Tuttavia, se si utilizza la voce Joanna con il tag <lang>, Amazon Polly pronuncia la frase con la voce diJoanna in francese con accento americano:

<speak> Why didn't she just say, <lang xml:lang="fr-FR">'Je ne parle pas français?'</lang>.</speak>

Poiché Joanna non è madrelingua francese, la pronuncia si basa sulla sua lingua nativa, ovvero l'inglesedegli Stati Uniti. Ad esempio, sebbene una perfetta pronuncia francese presenti una /R/vibrata alveolarenella parola français, la voce di Joanna in inglese americano pronuncia questo fonema con il suonocorrispondente /r/.

Se si utilizza la voce di Giorgio, che parla italiano, con il seguente testo, Amazon Polly pronuncia la frasecon la voce di Giorgio e la pronuncia in italiano:

<speak> Mi piace Bruce Springsteen.</speak>

Voci completamente bilingueUna voce bilingue come Aditi (inglese indiano e hindi) è in grado di parlare due lingue fluentemente. Questoti offre la possibilità di utilizzare parole e frasi di entrambe le lingue in un unico testo utilizzando la stessavoce.

Al momento, Aditi è l'unica voce completamente bilingue disponibile.

Utilizzo di una voce bilingue (Aditi)

Aditi parla sia inglese indiano (en-IN) sia hindi (hi-IN) in modo scorrevole. È possibile sintetizzare testo siain inglese sia in hindi e la voce può passare da una lingua all'altra anche all'interno della stessa frase.

L'hindi può essere utilizzato in due diverse forme:

• Devanagari: "उसन कहा, खल तोह अब शर होगा"• Romanagari (alfabeto latino): "Usne kahan, khel toh ab shuru hoga"

Inoltre, è possibile combinare inglese e una o entrambe le forme di hindi all'interno di una stessa frase:

• Devanagari + inglese: "This is the song कभी कभी अदिति"• Romanagari + inglese: "This is the song from the movie Jaane Tu Ya Jaane Na."• Devanagari + romanagari + inglese: "This is the song कभी कभी अदिति from the movie Jaane Tu Ya Jaane

Na."

15

Amazon Polly Developer GuideAscolto delle voci

Poiché Aditi è una voce bilingue, il testo riportato in tutti questi esempi sarà letto correttamente, perchéAmazon Polly è in grado di distinguere lingue e scritture.

Amazon Polly supporta anche numeri, date, orari e valute sia in inglese (numeri arabi) sia in hindi (numeridevanagari). Per impostazione predefinita, i numeri arabi vengono letti in inglese indiano. Per fare in modoche Amazon Polly li legga in hindi, è necessario utilizzare il parametro di codice della lingua hi-IN.

Ascolto delle vociÈ possibile utilizzare la console di Amazon Polly per ascoltare un esempio di una qualsiasi delle vocidisponibili in Amazon Polly

Per ascoltare una voce in Amazon Polly


2. Scegli la scheda Text-to-Speech (Sintesi vocale).3. Per Engine (Motore), scegliere Standard o Neural (Neurale).4. Scegliere una lingua e la regione, quindi scegliere una voce.5. Inserire il testo che si desidera venga pronunciato dalla voce o utilizzare la frase di default, quindi

scegliere Listen to speech (Ascolta sintesi vocale).

È possibile scegliere una qualsiasi delle lingue offerte da Amazon Polly e la console mostrerà le vocidisponibili per tale lingua. Nella maggior parte dei casi, vi sarà almeno una voce maschile e una femminile(spesso ce n'è più di una). Solo alcune lingue hanno una voce singola. Per un elenco completo, consultaVoci in Amazon Polly (p. 12)

Note

L'inventario di voci e il numero di lingue incluse viene costantemente aggiornato per includereopzioni aggiuntive. Per suggerire una nuova lingua o voce, non esitare a fornire un feedback suquesta pagina. Purtroppo, non siamo in grado di dare informazioni sui piani di rilascio di nuovelingue.

Ogni voce viene creata utilizzando persone madrelingua, perciò possono esserci variazioni da voce avoce, anche all'interno della stessa lingua. Quando si seleziona una voce per il progetto, è necessariotestare ciascuna delle voci possibili con un passaggio di testo per vedere quale si adatta meglio alle proprieesigenze.

Velocità vocaleA causa della variazione naturale tra le voci, ogni voce disponibile leggerà il testo a velocità leggermentediverse. Ad esempio, con le voci inglese americano, Ivy e Joanna sono leggermente più veloci di Matthewquando pronunciano "Mary had a little lamb", e molto più veloci di Joey.

Poiché c'è tanta variazione tra le voci e il grado di tale variazione può dipendere dal testo pronunciato,per le voci di Amazon Polly non è disponibile una velocità standard (parole al minuto). Tuttavia, èpossibile stabilire la quantità di tempo necessaria alla voce per pronunciare il testo selezionato utilizzandoSpeechMarks. Per ulteriori informazioni sull'uso di contrassegni vocali in Amazon Polly, consulta Utilizzodei contrassegni vocali (p. 104)

Per constatare il tempo approssimativo necessario per pronunciare un brano di testo

1. Aprire AWS CLI.

16



Amazon Polly Developer GuideModificare la velocità vocale

2. Eseguire il seguente codice, completandolo in base alle esigenze

aws polly synthesize-speech \ --language-code optional language code if needed --output-format json \ --voice-id [name of desired voice] \ --text '[desired text]' \ --speech-mark-types='["viseme"]' \ LengthOfText.txt

3. Aprire LengthOfText.txt

Se il testo fosse "Mary aveva un agnellino", le ultime righe restituite da Amazon Polly sarebbero leseguenti:

{"time":882,"type":"viseme","value":"t"} {"time":964,"type":"viseme","value":"a"} {"time":1082,"type":"viseme","value":"p"}

L'ultimo viseme, cioè il suono delle ultime lettere in "agnello", comincia 1082 millisecondi dopo l'inizio deldiscorso. Sebbene non sia esattamente la lunghezza dell'audio, è comunque prossima e può servire comebase per il confronto tra le voci.

Modificare la velocità vocaleIn alcune applicazioni, potrebbe essere più indicato rallentare o velocizzare la voce scelta. Se la velocitàdella voce è un problema, Amazon Polly offre la possibilità di modificarla utilizzando i tag SSML.

Ad esempio:

Un'organizzazione sta creando un'applicazione che legga i libri a pubblici di immigranti. Il pubblico parlainglese, ma non correntemente. In questo caso, si può considerare la possibilità di rallentare la velocitàdi lettura per concedere al pubblico un po' più di tempo per comprensione ciò che l'applicazione stapronunciando.

Amazon Polly consente di ridurre la velocità del discorso utilizzando il tag SSML <prosody>, come in:

<speak> In some cases, it might help your audience to <prosody rate="85%">slow the speaking rate slightly to aid in comprehension.</prosody><speak

oppure

<speak> In some cases, it might help your audience to <prosody rate="85%">slow the speaking rate slightly to aid in comprehension.</prosody><speak

Se si usa SSML con Amazon Polly, sono disponibili due opzioni di velocità:

• Velocità preimpostate: x-slow, slowmedium, fast e x-fast. In questi casi, la velocità di ciascunaopzione è approssimativa, a seconda della voce preferita. L'opzione medium è la velocità normale dellavoce.

• n% della velocità del discorso: può essere utilizzata qualsiasi percentuale di velocità del discorso,compresa tra 20% e 200%. In questi casi, è possibile scegliere esattamente la velocità desiderata.Tuttavia, la velocità reale della voce è approssimativa e dipende dalla voce scelta. Una percentuale di100% è considerata come la velocità normale della voce.

17

Amazon Polly Developer GuideLingue supportate da Amazon Polly

Poiché la velocità di ciascuna opzione è approssimativa e dipende dalla voce scelta, è consigliabileverificare la voce selezionata a varie velocità per capire esattamente cosa soddisfa le proprie esigenze.

Per ulteriori informazioni sull'utilizzo del tag prosody per ottenere l'effetto migliore, consulta Controllo divolume, velocità di pronuncia e intonazione (p. 121)

Lingue supportate da Amazon PollyLe lingue seguenti sono supportate da Amazon Polly e possono essere utilizzate per sintetizzare i discorsi.Con ogni lingua viene fornito il codice della lingua. Questi codici lingua sono i tag di identificazione dellalingua di W3C (codice ISO 639-3 del nome della lingua e codice del paese ISO 3166).

Per le tabelle approfondite che mostrano i fonemi e i visemi associati a ogni lingua, scegliere il link inciascuna lingua nella tabella sottostante.

Lingua Codice lingua

Arabo (arb) (p. 20) arb

Cinese, mandarino (cmn-CN) (p. 23) cmn-CN

Danese (da-DK) (p. 25) da-DK

Olandese (nl-NL) (p. 28) nl-NL

Inglese, Australia (en-AU) (p. 31) en-AU

Inglese, Regno Unito (en-GB) (p. 36) en-GB

Inglese, India (en-IN) (p. 34) en-IN

Inglese, India (en-IN) (p. 39) en-US

Inglese, Galles (en-GB-WSL) (p. 42) en-GB-WLS

Francese (fr-FR) (p. 45) fr-FR

Francese, Canada (fr-CA) (p. 47) fr-CA

Hindi (hi-IN) (p. 52) hi-IN

Tedesco (de-DE) (p. 49) de-DE

Islandese (is-IS) (p. 55) is-IS

Italiano (it-IT) (p. 58) it-IT

Giapponese (ja-JP) (p. 60) ja-JP

Coreano (ko-KR) (p. 62) ko-KR

Norvegese (nb-NO) (p. 64) nb-NO

Polacco (pl-PL) (p. 67) pl-PL

Portoghese, Brasile (pt-BR) (p. 71) pt-BR

Portoghese (pt-PT) (p. 69) pt-PT

Romeno (ro-RO) (p. 73) ro-RO

18

Amazon Polly Developer GuideTabelle fonemi e visemi per le lingue supportate

Lingua Codice lingua

Russo (ru-RU) (p. 75) ru-RU

Spagnolo (es-ES) (p. 78) es-ES

Spagnolo, Messico (es-MX) (p. 81) es-MX

Spagnolo, Stati Uniti (es-US) (p. 83) es-US

Svedese (sv-SE) (p. 86) sv-SE

Turco (tr-TR) (p. 89) tr-TR

Gallese (cy-GB) (p. 92) cy-GB

Per ulteriori informazioni, consulta Tabelle fonemi e visemi per le lingue supportate (p. 19).

Tabelle fonemi e visemi per le lingue supportateLe seguenti tabelle elencano i fonemi per le lingue supportate da Amazon Polly, insieme agli esempi e aivisemi corrispondenti.

Argomenti• Arabo (arb) (p. 20)• Cinese, mandarino (cmn-CN) (p. 23)• Danese (da-DK) (p. 25)• Olandese (nl-NL) (p. 28)• Inglese, Australia (en-AU) (p. 31)• Inglese, India (en-IN) (p. 34)• Inglese, Regno Unito (en-GB) (p. 36)• Inglese, Stati Uniti (en-US) (p. 39)• Inglese, Galles (en-GB-WSL) (p. 42)• Francese (fr-FR) (p. 45)• Francese, Canada (fr-CA) (p. 47)• Tedesco (de-DE) (p. 49)• Hindi (hi-IN) (p. 52)• Islandese (is-IS) (p. 55)• Italiano (it-IT) (p. 58)• Giapponese (ja-JP) (p. 60)• Coreano (ko-KR) (p. 62)• Norvegese (nb-NO) (p. 64)• Polacco (pl-PL) (p. 67)• Portoghese (pt-PT) (p. 69)• Portoghese, Brasile (pt-BR) (p. 71)• Romeno (ro-RO) (p. 73)• Russo (ru-RU) (p. 75)• Spagnolo (es-ES) (p. 78)• Spagnolo, Messico (es-MX) (p. 81)

19


• Spagnolo, Stati Uniti (es-US) (p. 83)• Svedese (sv-SE) (p. 86)• Turco (tr-TR) (p. 89)• Gallese (cy-GB) (p. 92)

Arabo (arb)La tabella seguente elenca i fonemi dell'alfabeto fonetico internazionale (International Phonetic Alphabet,IPA), i simboli X-SAMPA (Extended Speech Assessment Methods Phonetic Alphabet) e i corrispondentivisemi della voce araba di Zeina, supportata da Amazon Polly.

Tabella fonemi/visemi

IPA X-SAMPA Descrizione Esempio Visema

Consonanti

ʔ ? occlusiva glottidalesorda

أنا

ʕ ?\ fricativa faringalesonora

عمر k

b b occlusiva bilabialesonora

بلد p

d d occlusiva alveolaresonora

داري t

dˤ d_?\ occlusiva alveolaresonora enfatica

ضوء t

dʒ dZ affricatapostalveolare sonora

جميل S

ð D fricativa dentalesonora

ذلك T

ðˤ D_?\ fricativa dentalesonora enfatica

ظلام T

f f fricativa labiodentalesorda

فصل f

ɡ g occlusiva velaresonora

إنجلترا k

ɣ G fricativa velaresonora

غرب k

h h fricativa glottidalesorda

هذا k

j j approssimantepalatale

يمشي i

k k occlusiva velaresorda

كلب k

20



l l approssimantealveolare laterale

لاقى t

lˠ l_G laterale alveolareapprossimanteenfatica

الله t

m m nasale bilabiale ماذا p

n n nasale alveolare نور t

p p occlusiva bilabialesorda

حبس p

q q occlusiva uvularesorda

قريب k

r r vibrante alveolare رمل r

s s fricativa alveolaresorda

سؤال s

sˤ s_?\ fricativa alveolaresorda enfatica

صاحب s

ʃ S fricativapostalveolare sorda

شكر S

t t occlusiva alveolaresorda

تمر t

tˤ t_?\ occlusiva alveolaresorda enfatica

طالب t

θ T fricativa dentalesorda

ثلاث T

v v fricativa labiodentalesonora

فيتامين f

w w approssimantelabiovelare

ولد u

x x fricativa velare sorda خوف k

ħ X\ fricativa faringalesorda

حول k

z z fricativa alveolaresonora

زهور s

Vocali

a a vocale anterioreaperta nonarrotondata

برد a

21



aː a: vocale anterioreaperta nonarrotondata allungata

دار a

ɑˤ A_?\ vocale posterioreaperta nonarrotondata enfatica

طبل a

ɑˤː A_?\: vocale posterioreaperta nonarrotondata enfatica

ظالم a

u u vocale posteriorechiusa arrotondata

شرب u

u: u: vocale posteriorechiusa arrotondataallungata

سور u

uˤ u_?\ vocale posteriorechiusa arrotondataenfatica

بد u

uˤː u_?\: vocale posteriorechiusa arrotondataenfatica

طول u

i i vocale anteriorechiusa nonarrotondata

بنت i

iː i: vocale anteriorechiusa nonarrotondata allungata

حزين i

iˤ i_?\ vocale anteriorechiusa nonarrotondata enfatica

ضد i

iˤː i_?\: vocale anteriorechiusa nonarrotondata enfatica

ماضي i

e e vocale anterioresemichiusa nonarrotondata

ماركت e

eː e: vocale anterioresemichiusa nonarrotondata allungata

موديل e

ɔ O vocale posterioresemiapertaarrotondata

تكنولوجي O

ɔː O: vocale posterioresemiapertaarrotondata allungata

تليفزيون O

22


Cinese, mandarino (cmn-CN)La tabella seguente elenca i fonemi di Pinyin e dell’alfabeto fonetico internazionale (IPA) della voce cinesemandarino supportata da Amazon Polly. Pinyin è lo standard internazionale per la romanizzazione standarddel cinese. I sistemi IPA e X-SAMPA non sono solitamente utilizzati, ma sono disponibili per il supportoinglese. I simboli IPA e X-SAMPA presenti nella tabella fungono solo da riferimento e non devono essereutilizzati per la trascrizione cinese. Vengono anche visualizzati esempi di Pinyin e i corrispondenti visemi.

Per fare in modo che Amazon Polly utilizzi la pronuncia fonetica con Pinyin, utilizza il tag phonemealphabet="x-amazon-phonetic standard used".

I seguenti esempi mostrano questo per ogni standard.

Pinyin:

<speak> ## <phoneme alphabet="x-amazon-pinyin" ph="bo2">#</phoneme># ## <phoneme alphabet="x-amazon-pinyin" ph="bao2">#</phoneme>#</speak>

IPA:

<speak> ## <phoneme alphabet="ipa" ph="p##k##n">pecan</phoneme># ## <phoneme alphabet="ipa" ph="#pi.kæn">pecan</phoneme>#</speak>

X-SAMPA:

<speak> ## <phoneme alphabet='x-sampa' ph='pI"kA:n'>pecan</phoneme># ## <phoneme alphabet='x-sampa' ph='"pi.k{n'>pecan</phoneme>#</speak>

Note

Amazon Polly accetta solo l'input in cinese mandarino codificato in UTF-8. Lo standard di codificaGB 18030 non è attualmente supportato da Amazon Polly.


Pinyin IPA X-SAMPA

Descrizione Esempio diPinyin

Visema

Consonanti

f f f fricativa labiodentale sorda 发, fa1 f

h h h fricativa glottidale sorda 和, he2 k

g k k occlusiva velare sorda 古, gu3 k

k kʰ k_h Occlusiva velare sordaaspirata

苦, ku3 k

l l l approssimante alveolarelaterale

拉, la1 t

m m m nasale bilabiale 骂, ma4 p

23


Pinyin IPA X-SAMPA


Visema

n n n nasale alveolare 那, na4 t

ng ŋ N nasale velare 正, zheng4 k

b p p occlusiva bilabiale sorda 爸, ba4 p

p pʰ p_h Occlusiva bilabiale sordaaspirata

怕, pa4 p

s s s fricativa alveolare sorda 四, si4 s

x ɕ s\ fricativa alveolopalatalesorda

西, xi1 J

sh ʂ s` fricativa retroflessa sorda 是, shi4 S

d t t occlusiva alveolare sorda 打, da3 t

t tʰ t_h Occlusiva alveolare sordaaspirata

他, ta1 t

zh ʈʂ t`s` affricata retroflessa sorda 之, zhi1 S

ch ʈʂʰ t`s`_h affricata retroflessa sordaaspirata

吃, chi1 S

s ts ts affricata alveolare sorda 字, zi4 s

j tɕ ts\ affricata alveolopalatalesorda

鸡, ji1 J

q tɕʰ ts\_h affricata alveolopalatalesorda aspirata

七, qi1 J

c tsʰ ts_h affricata alveolare sordaaspirata

次, ci4 s

w w w approssimante labiovelare 我, wo3 u

r ʐ z` fricativa retroflessa sonora 日, ri4 S

sillabe rotiche "er" e "r"

er ɚ @` vocale centrale mediavariante rotica

二, er4 @

-r sillaba rotica 馅儿, xianr4 @

Vocali

e ɤ 7 vocale posterioresemichiusa nonarrotondata

恶, e4 e

e ə @ vocale centrale media 恩, en1 @

a a a vocale anteriore aperta nonarrotondata

安, an1 a

24


Pinyin IPA X-SAMPA


Visema

ai aɪ aI dittongo 爱, ai4 a

ao aʊ aU dittongo 奥, ao4 a

ei eɪ e dittongo 诶, ei4 e

e ɛ E vocale anterioresemiaperta nonarrotondata

姐, jie3 E

i i i vocale anteriore chiusanon arrotondata

鸡, ji1 i

ou oʊ oU dittongo 欧, ou1 o

o ɔ O vocale posterioresemiaperta arrotondata

哦, o4 o

u u u vocale posteriore chiusaarrotondata

主, zhu3 u

yu y y vocale anteriore chiusaarrotondata

于, yu2 u

Contrassegni tono e simboli aggiuntivi

1 tono alto 淤, yu1

2 tono crescente 鱼, yu2

3 tono basso (decrescente/crescente)

语, yu3

4 tono decrescente 育, yu4

0 tono neutro 的, de0

- . . sillabazione 语音 yu3-yin1

Danese (da-DK)La tabella seguente elenca i fonemi dell'alfabeto fonetico internazionale (International Phonetic Alphabet,IPA), i simboli X-SAMPA (Extended Speech Assessment Methods Phonetic Alphabet) e i corrispondentivisemi per la lingua danese supportati da Amazon Polly.



Consonanti


bat p


da t

25




mad, thriller T


fat f

g g occlusiva velaresonora

gat k


hat k


jo i


kat k


ladt t

m m nasale bilabiale mat p

n n nasale alveolare nay t

ŋ N nasale velare lang k


pande p

r r vibrante alveolare thriller, story r

ʁ R fricativa uvularesonora

rat k


sat s


tal t


vat f

w w approssimantelabiovelare sonora

hav, weekend u

Vocali

ø 2 vocale anterioresemichiusaarrotondata

øst o

ø: 2: vocale anterioresemichiusaarrotondata allungata

øse o

ɐ 6 vocale centrale quasiaperta

mor a

26



œ 9 vocale anterioresemiapertaarrotondata

skøn, grønt O

œ: 9: vocale anterioresemiapertaarrotondata allungata

høne, gøre O

ə @ vocale centralemedia

ane @

æː {: vocale anteriorequasi aperta nonarrotondata allungata

male a


man a

æ { vocale anteriorequasi aperta nonarrotondata

adresse a

ɑ A vocale posterioreaperta nonarrotondata

lak, tak a

ɑ: A: vocale posterioreaperta nonarrotondata allungata

rase a


midt e

e: e: vocale anterioresemichiusa nonarrotondata allungata

mele e

ɛ E vocale anterioresemiaperta nonarrotondata

mæt E

ɛ: E: vocale anterioresemiaperta nonarrotondata allungata

mæle E


mit i

i: i: vocale anteriorechiusa nonarrotondata allungata

mile i

o o vocale posterioresemichiusaarrotondata

foto o

27



o: o: vocale posterioresemichiusaarrotondata allungata

mole o


mund O

ɔ: O: vocale posterioresemiapertaarrotondata allungata

måle O

ɒː D: vocale posterioresemiapertaarrotondata allungata

morse O


lusk u


mule u

ʌ V posterioresemiaperta nonarrotondata

kører E

y y vocale anteriorechiusa arrotondata

yt u

y: y: vocale anteriorechiusa arrotondataallungata

hyle u

Simboli aggiuntivi

ˈ " enfasi principale Alabama

ˌ % enfasi secondaria Alabama

. . sillabazione A.la.ba.ma

Olandese (nl-NL)La tabella seguente elenca i fonemi dell'alfabeto fonetico internazionale (International Phonetic Alphabet,IPA), i simboli X-SAMPA (Extended Speech Assessment Methods Phonetic Alphabet) e i corrispondentivisemi per la lingua olandese supportati da Amazon Polly.



Consonanti


bak p

28




dak t


manager S


fel f


goal k


hoed k

ɦ h\ fricativa glottalesonora

hand k


ja i


kap k


land t

m m nasale bilabiale met p

n n nasale alveolare net t

ŋ N nasale velare bang k


pak p

r r vibrante alveolare rand r


sein s


show S


tak t


vel f

ʋ v\ approssimantelabiodentale

wit f

x x fricativa velare sorda toch k


ziin s

29



ʒ Z fricativapostalveolare sonora

bagage S

Vocali

øː 2: vocale anterioresemichiusaarrotondata allungata

neus o

œy 9y dittongo buit O


de @

a: a: vocale anterioreaperta nonarrotondata allungata

baad a

ɑ: A vocale posterioreaperta nonarrotondata

bad a


beet e

ɜː 3: vocale centralesemiaperta nonarrotondata allungata

barrière E


bed E

ɛi Ei dittongo beet E


vier i

ɪ I vocale quasianteriore quasichiusa nonarrotondata

pit i


boot o


pot O


hoed u

ʌu Vu dittongo fout E

30



yː y: vocale anteriorechiusa arrotondataallungata

fuut u

ʏ Y vocale quasianteriore quasichiusa arrotondata

hut u

Simboli aggiuntivi




Inglese, Australia (en-AU)La tabella seguente elenca i fonemi dell'alfabeto fonetico internazionale (International Phonetic Alphabet,IPA), i simboli X-SAMPA (Extended Speech Assessment Methods Phonetic Alphabet) e i corrispondentivisemi per la lingua inglese australiano supportati da Amazon Polly.



Consonanti


bed p


dig t


jump S


then T


five f


game k


house k


yes i


cat k


lay t

31



l l= laterale alveolareapprossimantesillabica

battle t

m m nasale bilabiale mouse p

m m= nasale bilabialesillabica

anthem p

n n nasale alveolare nap t

n n= nasale alveolaresillabica

nap t

ŋ N nasale velare thing k


pin p

ɹ r\ approssimantealveolare

red r


seem s


ship S


task t

tʃ tS affricatapostalveolare sorda

chart S

Θ T fricativa dentalesorda

thin T


vest f


west u


zero s


vision S

Vocali


arena @

əʊ @U dittongo goat @


trap a

32



aɪ aI dittongo price a

aʊ aU dittongo mouth a

ɑː A: vocale posterioreaperta nonarrotondata allungata

father a

eɪ eI dittongo face e


nurse E


dress E

ɛə E@ dittongo square E

i: i vocale anteriorechiusa nonarrotondata allungata

fleece i


kit i

ɪə I@ dittongo near i

ɔː OI vocale posterioresemiapertaarrotondata allungata

thought O

ɔɪ OI Dittongo choice O

ɒ Q vocale posterioreaperta arrotondata

lot O


goose u

ʊ U vocale quasiposteriore quasichiusa arrotondata

foot u

ʊə U@ dittongo cure u

ʌ V vocale posterioresemiaperta nonarrotondata

strut E

Simboli aggiuntivi



33




Inglese, India (en-IN)La tabella seguente elenca i fonemi dell'alfabeto fonetico internazionale (International Phonetic Alphabet,IPA), i simboli X-SAMPA (Extended Speech Assessment Methods Phonetic Alphabet) e i corrispondentivisemi per la lingua inglese indiano supportati da Amazon Polly.

Per ulteriori fonemi utilizzati insieme all'inglese indiano, vedi Hindi (hi-IN) (p. 52).



Consonanti


bed p


dig t


jump S


then T


five f


game k


house k


yes i


cat k


lay t


battle t



anthem p


34




nap t



pin p


red r


seem s


ship S


task t


chart S


thin T


vest f


west u


zero s


vision S

Vocali


arena @



trap a




father a


35




nurse E


dress E



fleece i


kit i



thought O



lot O


goose u


foot u



strut E

Simboli aggiuntivi




Inglese, Regno Unito (en-GB)La tabella seguente elenca i fonemi dell'alfabeto fonetico internazionale (International Phonetic Alphabet,IPA), i simboli X-SAMPA (Extended Speech Assessment Methods Phonetic Alphabet) e i corrispondentivisemi per la lingua inglese britannico supportati da Amazon Polly.

36




Consonanti


bed p


dig t


jump S


then T


five f


game k


house k


yes i


cat k


lay t


battle t



anthem p



button t



pin p


red r


seem s

37




ship S


task t


chart S


thin T


vest f


west u


zero s


vision S

Vocali


arena @



trap a




father a



nurse E


dress E



fleece i

38




kit i


ɔː O: vocale posterioresemiapertaarrotondata allungata

thought O



lot O


goose u


foot u



strut E

Simboli aggiuntivi




Inglese, Stati Uniti (en-US)La tabella seguente elenca i fonemi dell'alfabeto fonetico internazionale (International Phonetic Alphabet,IPA), i simboli X-SAMPA (Extended Speech Assessment Methods Phonetic Alphabet) e i corrispondentivisemi per la lingua inglese americano supportati da Amazon Polly.



Consonanti


bed p


dig t

39




jump S


then T


five f


game k


house k


yes i


cat k


lay t





speak p


red r


seem s


ship S


trap t


chart S


thin T


vest f


west u


zero s

40




vision S

Vocali


arena @

ɚ @` vocale centralemedia variante rotica

reader @


trap a



ɑ A vocale posterioreaperta nonarrotondata allungata

father a


ɝ 3` vocale centralesemiaperta nonarrotondata versionerotica

nurse E


dress E

i i vocale anteriorechiusa nonarrotondata allungata

fleece i


kit i

oʊ oU dittongo goat o

ɔ O vocale posterioresemiapertaarrotondata allungata

thought O

ɔɪ OI dittongo choice O

u u vocale posteriorechiusa arrotondataallungata

goose u


foot u

41



ʌ V Vocale posterioresemiaperta nonarrotondata

strut E

Simboli aggiuntivi




Inglese, Galles (en-GB-WSL)La tabella seguente elenca i fonemi dell'alfabeto fonetico internazionale (International Phonetic Alphabet,IPA), i simboli X-SAMPA (Extended Speech Assessment Methods Phonetic Alphabet) e i corrispondentivisemi per la lingua inglese gallese supportati da Amazon Polly.



Consonanti


bed p


dig t


jump S


then T


five f


game k


house k


yes i


cat k


lay t


battle t

42





anthem p



nap t



pin p


red r


seem s


ship S


task t


chart S


thin T


vest f


west u


zero s


vision S

Vocali


arena @



trap a



43




father a



nurse E


dress E



fleece i


kit i



thought O



lot O


goose u


foot u



strut E

Simboli aggiuntivi




44


Francese (fr-FR)La tabella seguente elenca i fonemi dell'alfabeto fonetico internazionale (International Phonetic Alphabet,IPA), i simboli X-SAMPA (Extended Speech Assessment Methods Phonetic Alphabet) e i corrispondentivisemi per la lingua francese supportati da Amazon Polly.



Consonanti


boire p


madame t


femme f


grand k

ɥ H approssimante labio-palatale

bruit u


meilleur i


quatre k


malade t

m m nasale bilabiale maison p

n n nasale alveolare astronome t

ɲ J nasale palatale baigner J

ŋ N nasale velare parking k


pomme p


amoureux k


santé s


chat S


téléphone t


vrai f

45




soir u


raison s


aubergine S

Vocali


deux o


neuf O

œ 9~ vocale anterioresemiapertaarrotondata nasale

brun O


je @


table a

ɑ A~ vocale posterioreaperta nonarrotondata nasale

camembert a


marché e


neige E

ɛ E~ vocale anterioresemiaperta nonarrotondata nasale

sapin E


mille i


hôpital o


homme O

46



ɔ O~ vocale posterioresemiapertaarrotondata nasale

bon O


sous u


dur u

Simboli aggiuntivi




Francese, Canada (fr-CA)La tabella seguente elenca i fonemi dell'alfabeto fonetico internazionale (International Phonetic Alphabet,IPA), i simboli X-SAMPA (Extended Speech Assessment Methods Phonetic Alphabet) e i corrispondentivisemi per la lingua francese canadese supportati da Amazon Polly.



Consonanti


boire p


madame t


femme f


grand k

ɥ H approssimante labio-palatale

bruit u


meilleur i


quatre k


malade t

m m nasale bilabiale maison p

n n nasale alveolare astronome t

47



ɲ J nasale palatale baigner J

ŋ N nasale velare parking k


pomme p


amoureux k


santé s


chat S


téléphone t


vrai f


soir u


raison s


aubergine S

Vocali


deux o


neuf O

œ 9~ vocale anterioresemiapertaarrotondata nasale

brun O


je @


table a


camembert a

48




marché e


neige E


sapin E


mille i


hôpital o


homme O


bon O


sous u


dur u

Simboli aggiuntivi




Tedesco (de-DE)La tabella seguente elenca i fonemi dell'alfabeto fonetico internazionale (International Phonetic Alphabet,IPA), i simboli X-SAMPA (Extended Speech Assessment Methods Phonetic Alphabet) e i corrispondentivisemi per la lingua tedesca supportati da Amazon Polly.



Consonanti


49




Bier p


Dach t

ç C fricativa palatalesorda

ich k


Dschungel S

f f Fricativa labiodentalesorda

Vogel f

g g Occlusiva velaresonora

Gabel k

h h Fricativa faringalesorda

Haus k

j j Fricativa faringalesorda

jemand i

k k Occlusiva velaresorda

Kleid k

l l Laterale alveolareapprossimante

Loch t

m m Nasale bilabiale Milch p

n n Nasale alveolare Natur t

ŋ N Nasale velare klingen k

p p Occlusiva bilabialesorda

Parca p

pf pf Affricata labiodentalesorda

Apfel

ʀ R Vibrante uvulare Regen


Messer s

ʃ S Fricativapostalveolare sorda

Fischer S

t t Occlusiva alveolaresorda

Topf T

ts Ts Affricata alveolaresorda

Zahl

tʃ tS Affricatapostalveolare sorda

deutsch S

50



v v Fricativa labiodentalesonora

Wasser f

x x Fricativa velare sorda kochen k

z z Fricativa alveolaresonora

See s

ʒ Z Fricativapostalveolare sonora

Orange S

Vocali


böse o

ɐ 6 vocale centrale quasiaperta

besser a

ɐ 6_^ vocale centrale quasiaperta non sillabica

Klar a


können O


Rede @


Salz a


Sahne a

aɪ aI dittongo nein a

aʊ aU dittongo Augen a


Restaurant a


Rede e


Keller E


Terrain E

51




Lied i


bitte i


Kohl o


Koffer O


Annonce O

ɔʏ OY dittongo neu O


Bruder u


Wunder u


kühl u


Küche u

Simboli aggiuntivi




Hindi (hi-IN)La tabella seguente elenca i fonemi dell'alfabeto fonetico internazionale (International Phonetic Alphabet,IPA), i simboli X-SAMPA (Extended Speech Assessment Methods Phonetic Alphabet) e i tipi di suono delfonema per le voci hindi supportati da Amazon Polly.

Per ulteriori fonemi utilizzati insieme all'hindi, vedi Inglese, India (en-IN) (p. 34).

52



IPA X-SAMPA Descrizione Esempio

Consonanti

pʰ p_h occlusiva bilabiale sordaaspirata

फल (phool)

bʱ b_h occlusiva bilabiale sonoraaspirata

भारी (bhaari)

t t_d occlusiva dentale sorda तापमान (taapmaan)

tʰ t_d_h occlusiva dentale sordaaspirata

थोडा (thoda)

d d_d occlusiva dentale sonora दिलली (dilli)

dʱ d_d_h occlusiva dentale sonoraaspirata

धोबी (dhobi)

ʈ t` occlusiva retroflessa sorda कटोरा (katora)

ʈʰ t`_h occlusiva retroflessa sordaaspirata

ठड (thand)

ɖ d` occlusiva retroflessa sonora डर (darr)

ɖʱ d`_h occlusiva retroflessa sonoraaspirata

ढाल (dhal)

tʃʰ tS_h affricata palatale sordaaspirata

छाल (chaal)

dʒʱ dZ_h affricata palatale sonoraaspirata

झाल (jhaal)

kʰ k_h occlusiva velare sordaaspirata

खान (khan)

ɡʱ g_h occlusiva velare sonoraaspirata

घान (ghaan)

ɳ n` nasale retroflessa कषण (kshan)

ɾ 4 monovibrante alveolare राम (ram)

ɽ r` monovibrante retroflessapiana

बडा (bada)

ɽʱ r`_h monovibrante retroflessasonora aspirata

बढी (barhi)

ʋ v\ approssimante bilabiale वसल (wasool)

Vocali

ə @_o vocale centrale media अचछा (achhaa)

ə @~ vocale centrale medianasalizzata

हसना (hansnaa)

53


IPA X-SAMPA Descrizione Esempio

a A_o vocale anteriore aperta nonarrotondata

आग (aag)

a A~ vocale anteriore aperta nonarrotondata nasalizzata

घडिया (ghariyaan)

ɪ I_o vocale quasi anteriore quasichiusa non arrotondata

इककीस (ikkees)

ɪ I~ vocale quasi anteriore quasichiusa non arrotondatanasalizzata

सिचाई (sinchai)

i i_o vocale anteriore chiusa nonarrotondata

बिलली (billee)

i i~ vocale anteriore chiusa nonarrotondata nasalizzata

नही (nahin)

ʊ U_o vocale quasi posteriorequasi chiusa arrotondata

उलल (ullu)

ʊ U~ vocale quasi posteriorequasi chiusa nasalizzata

मह (munh)

u u_o vocale posteriore chiusaarrotondata

फल (phool)

u u~ vocale posteriore chiusaarrotondata nasalizzata

ऊट (oont)

ɔ O_o vocale posterioresemiaperta arrotondata

कौन (kaun)

ɔ O~ vocale posterioresemiaperta arrotondatanasalizzata

भौ (bhaun)

o o vocale posterioresemichiusa arrotondata

सोना (sona)

o o~ vocale posterioresemichiusa arrotondatanasalizzata

कयो (kyon)

ɛ E_o vocale anteriore semiapertanon arrotondata

पसा (paisa)

ɛ E~ vocale anteriore semiapertanon arrotondata nasalizzata

म (main)

e e vocale anteriore semichiusanon arrotondata

एक (ek)

e e~ vocale anteriore semichiusanon arrotondata nasalizzata

किताब (kitabein)

54


Islandese (is-IS)La tabella seguente elenca i fonemi dell'alfabeto fonetico internazionale (International Phonetic Alphabet,IPA), i simboli X-SAMPA (Extended Speech Assessment Methods Phonetic Alphabet) e i corrispondentivisemi per la lingua islandese supportati da Amazon Polly.



Consonanti


grasbakkanum 0

c c Occlusiva palatalesorda

pakkin k

cʰ c_h Occlusiva palatalesorda aspirata

anarkistai k


héðan k


bóndi t


borð T


duft f


holgóma k


hugur k


heili k


jökull i

kʰ k_h Occlusiva velaresorda aspirata

ósköpunum k


gólf t

l l_0 laterale alveolareapprossimante sorda

fólk t

m m nasale bilabiale september p

m m_0 Nasale bilabialesorda

kompa p

n n nasale alveolare númer t

55



n n_0 Nasale alveolaresorda

pöntun t

ɲ J nasale palatale pælingar J

ŋ N nasale velare söngvarann k

ŋ N_0 Nasale velare sorda frænka k

pʰ p_h Occlusiva bilabialesorda aspirata

afplánun p

r r vibrante alveolare afskrifta r

r r_0 Vibrante alveolaresorda

andvörpum r


baðhús s

tʰ t_h Occlusiva alveolaresorda aspirata

tanki t


þeldökki T


silfur f


u

x x fricativa velare sorda samfélags k

Vocali


þröskuldinum O

œː 9: vocale anterioresemiapertaarrotondata allungata

tvö O


nefna a


fara a

au au dittongo átta a

au: au: dittongo átján a


kennari E

56



ɛ: E: vocale anterioresemiaperta nonarrotondata allungata

dreka E


Gúlíver i


þrír i


samspil i

ɪ: I: vocale quasianteriore quasichiusa nonarrotondata allungata

stig i


regndropar O

ɔ: O: vocale posterioresemiapertaarrotondata allungata

ullarbolur O

ɔu Ou dittongo tólf O

ɔu: Ou: dittongo fjórir O


stúlkan u


frú u


tíu u

ʏ: Y vocale quasianteriore quasichiusa arrotondataallungata

gruninn u

Simboli aggiuntivi




57


Italiano (it-IT)La tabella seguente elenca i fonemi dell'alfabeto fonetico internazionale (International Phonetic Alphabet,IPA), i simboli X-SAMPA (Extended Speech Assessment Methods Phonetic Alphabet) e i corrispondentivisemi per la lingua italiana supportati da Amazon Polly.



Consonanti


bacca p


dama t

dz dz affricata alveolaresonora

zero s


giro S


famiglia f


gatto k


horror k


dieci i


campo k


lido t

ʎ L approssimantelaterale palatale

aglio J

m m nasale bilabiale mille p

n n nasale alveolare nove t

ɲ J nasale palatale lasagne J


pizza p

r r vibrante alveolare risata r


sei s


scienza S

58




tavola t

ts ts affricata alveolaresorda

forza s


cielo S


venti f


quattro u


bisogno s


bijou S

Vocali


arco a


tre e


ettaro E


impero i


cento o


otto O


uno u

Simboli aggiuntivi




59


Giapponese (ja-JP)La tabella seguente elenca i fonemi dell'alfabeto fonetico internazionale (International Phonetic Alphabet,IPA), i simboli X-SAMPA (Extended Speech Assessment Methods Phonetic Alphabet) e i corrispondentivisemi per la lingua giapponese supportati da Amazon Polly.


Consonanti

ɾ 4 monovibrantealveolare

練習, renshuu t


あつっ, atsu'


舞踊, buyou p

β B fricativa bilabialesonora

ヴィンテージ,vinteeji

B


ききょう, kikyou k


人, hito k


濁点, dakuten t

dʑ dz\ affricataalveopalatale sonora

純, jun J


ご飯, gohan k


本, hon k


屋根, yane i

ɟ J\ occlusiva palatalesonora

行儀, gyougi J


漢字, kanji k

ɺ l\ monovibrante lateralealveolare

釣り, tsuri r

ɺj l\j monovibrantelaterale alveolare,approssimantepalatale

流行, ryuukou r

m m nasale bilabiale 飯, meshi p

n n nasale alveolare 猫, neko t

60



ɲ J nasale palatale 日本, nippon J

ɴ N\ nasale uvulare 缶, kan k


パン, pan p

ɸ p\ fricativa bilabialesorda

福, huku f


層, sou s

ɕ s\ fricativaalveolopalatale sorda

書簡, shokan J


手紙, tegami t


釣り, tsuri s

tɕ ts\ affricataalveolopalatale sorda

吉, kichi J


電話, denwa u


座敷, zashiki s

Vocali

äː a:_" vocale centraleaperta nonarrotondata allungata

羽蟻, haari a

ä a_" vocale centraleaperta nonarrotondata

仮名, kana a

eː e:_o vocale anterioremedia nonarrotondata allungata

学生, gakusei @

e e_o vocale anterioremedia nonarrotondata

歴, reki @


気, ki i

iː i: vocale anteriorechiusa nonarrotondata allungata

詩歌, shiika i

61



ɯ M vocale posteriorechiusa nonarrotondata

運, un i

ɯː M: vocale posteriorechiusa nonarrotondata allungata

宗教, shuukyou i

oː o:_o vocale posterioremedia arrotondataallungata

購読, koodoku o

o o_o vocale posterioremedia arrotondata

読者, dokusha o

Coreano (ko-KR)La tabella seguente elenca i fonemi dell'alfabeto fonetico internazionale (International Phonetic Alphabet,IPA), i simboli X-SAMPA (Extended Speech Assessment Methods Phonetic Alphabet) e i corrispondentivisemi per la lingua coreana supportati da Amazon Polly.


Consonanti


강, [g]ang k

k# k_t Occlusiva velaresorda forte

깨, [kk]e k

n n nasale alveolare 남, [n]am t


도, [d]o t

t# t_t Occlusiva alveolaresorda forte

때, [tt]e t


사랑, sa[r]ang t


돌, do[l] t

m m nasale bilabiale 무, [m]u p


봄, [b]om p

p# p_t Occlusiva bilabialesorda forte

뻘, [pp]eol p


새, [s]e s

62



s# s_t fricativa alveolaresorda forte

씨, [ss]i s

ŋ N nasale velare 방, ba[ng] k


조, [j]o J

t#ɕ ts\_t affricataalveolopalatale sordaforte

찌, [jj]i J

tɕʰ ts\_h affricataalveolopalatale sordaaspirata

차, [ch]a J

kʰ k_h Occlusiva velaresorda aspirata

코, [k]o k

tʰ t_h Occlusiva alveolaresorda aspirata

통, [t]ong t

pʰ p_h Occlusiva bilabialesorda aspirata

패, [p]e p


힘, [h]im k


양, [y]ang i


왕, [w]ang u

ɰ M\ approssimante velar> 의, [wj]i i

Vocali


밥, b[a]b a

ʌ V Vocale posterioresemiaperta nonarrotondata

정, j[eo]ng E


배, b[e] E


노, n[o] o


둘, d[u]l u

63




은, [eu]n i


김, k[i]m i

Norvegese (nb-NO)Il grafico seguente elenca tutto l'insieme di fonemi dell'alfabeto fonetico internazionale (InternationalPhonetic Alphabet, IPA) e i simboli X-SAMPA (Extended Speech Assessment Methods Phonetic Alphabet)e i corrispondenti visemi supportati da Amazon Polly per la lingua norvegese.


Consonanti


prøv t


labb p


kino k


ladd t

ɖ d` occlusiva retroflessasonora

verdi t


fot f

ɡ ɡ occlusiva velaresonora

tagg k


ha k


gi i


takk k


fall, ball t

ɭ l` approssimantelaterale retroflessa

ærlig t

m m nasale bilabiale lam p

64



n n nasale alveolare vann t

ɳ n` nasale retroflessa garn t

ŋ N nasale velare sang k


hopp p


lass s

ʂ s` fricativa retroflessasorda

års S


skyt S


Lat t

ʈ t` occlusiva retroflessasorda

hardt t

ʋ v\ approssimantelabiodentale

vin f


will x

Vocali


søt o


søtt O


ape @

æː {: vocale anteriorequasi aperta nonarrotondata allungata

vær a

ʉ } vocale centralechiusa arrotondata

lund u

ʉː }: vocale centralechiusa arrotondataallungata

lun u


vært a

65



ɑ A vocale posterioreaperta nonarrotondata

hatt a


hat a


sen e


send E


vin i


vind i

oː oː vocale posterioresemichiusaarrotondata allungata

våt o


vått O


bok u


bukk u


lyn u


lynne u

Simboli aggiuntivi




66


Polacco (pl-PL)La tabella seguente elenca i fonemi dell'alfabeto fonetico internazionale (International Phonetic Alphabet,IPA), i simboli X-SAMPA (Extended Speech Assessment Methods Phonetic Alphabet) e i corrispondentivisemi per la lingua polacca supportati da Amazon Polly.



Consonanti


bobas, belka p


dar, do t

dz dz affricata alveolaresonora

dzwon, widzowie s

dʑ dz\ affricataalveopalatale sonora

dźwięk J

dʐ dz` affricata retroflessasonora

dżem, dżungla S


furtka, film f


gazeta, waga k


chleb, handel k


jak, maja i


kura, marek k


lipa, alicja t

m m nasale bilabiale matka, molo p

n n nasale alveolare norka t

ɲ J nasale palatale koń, toruń J


pora, stop p

r r vibrante alveolare rok, park r


sum, pas s


śruba, śnieg J

67




szum, masz S


tok, stół t


car, co s


ćma, mieć J

tʂ ts` affricata retroflessasorda

czas, raczej S


worek, mewa f


łaska, mało u


zero s

ʑ z\ fricativaalveolopalatalesonora

źrebię, bieliźnie J

ʐ z` fricativa retroflessasonora

żar, żona S

Vocali


ja a


echo E


węże E


ile i


oczy O


wąż O

68




uczta u

ɨ 1 vocale centralechiusa nonarrotondata

byk i

Simboli aggiuntivi




Portoghese (pt-PT)La tabella seguente elenca i fonemi dell'alfabeto fonetico internazionale (International Phonetic Alphabet,IPA), i simboli X-SAMPA (Extended Speech Assessment Methods Phonetic Alphabet) e i corrispondentivisemi per la lingua portoghese supportati da Amazon Polly.



Consonanti


pira t


dato p


dato t


facto f


gato k


paraguay i


cacto k


galo t


galho J

m m nasale bilabiale mato p

n n nasale alveolare nato t

69



ɲ J nasale palatale pinha J


pato p

ʀ R\ vibrante uvulare barroso k


saca s


chato S


tacto t


vaca f


mau u


zaca s


jacto S

Vocali


parto a

a a~ vocale anterioreaperta nonarrotondata nasale

pega a


pega e

e e~ vocale anterioresemichiusa nonarrotondata nasale

movem e


café E


lingueta i

i i~ vocale anteriorechiusa nonarrotondata nasale

cinto i

70




poder o

o o~ vocale posterioresemichiusaarrotondata nasale

compra o


cotó O


fui u

u u~ vocale posteriorechiusa arrotondatanasale

sunto u

Simboli aggiuntivi




Portoghese, Brasile (pt-BR)La tabella seguente elenca i fonemi dell'alfabeto fonetico internazionale (International Phonetic Alphabet,IPA), i simboli X-SAMPA (Extended Speech Assessment Methods Phonetic Alphabet) e i corrispondentivisemi per la lingua brasiliana supportati da Amazon Polly.



Consonanti


pira t


bato p


dato t


idade S


facto f


gato k

71




paraguay i


cacto k


galo t


galho J

m m nasale bilabiale mato p

n n nasale alveolare nato t

ɲ J nasale palatale pinha J


pato p


saca s


chato S


tacto t


noite S


vaca f


mau u

χ X fricativa uvularesorda

carro k


zaca s


jacto S

Vocali


parto a

a a~ vocale anterioreaperta nonarrotondata nasale

pensamos a

72




pega e

e e~ vocale anterioresemichiusa nonarrotondata nasale

movem e


café E


lingueta i

i i~ vocale anteriorechiusa nonarrotondata nasale

cinto i


poder o

o o~ vocale posterioresemichiusaarrotondata nasale

compra o


cotó O


fui u

u u~ vocale posteriorechiusa arrotondatanasale

sunto u

Simboli aggiuntivi




Romeno (ro-RO)La tabella seguente elenca i fonemi dell'alfabeto fonetico internazionale (International Phonetic Alphabet,IPA), i simboli X-SAMPA (Extended Speech Assessment Methods Phonetic Alphabet) e i corrispondentivisemi per la lingua rumena supportati da Amazon Polly.

73




Consonanti


bubă p


după t


george S


afacere f


agri# k


harpă k


baie i


co# k


lampa t

m m nasale bilabiale mama p

n n nasale alveolare nor t


pilă p

r r vibrante alveolare rampă r


soare s


ma#ină S


tata t


#ară s


ceai S


via#ă f


beau u

74




mozol s


joacă S

Vocali


babă @


casa a


elan e

e e_^ vocale anterioresemichiusa nonarrotondata nonsillabica

beau e


mie i


oră o

oa o_^a dittongo oare o


unde u


România i

Simboli aggiuntivi




Russo (ru-RU)La tabella seguente elenca i fonemi dell'alfabeto fonetico internazionale (International Phonetic Alphabet,IPA), i simboli X-SAMPA (Extended Speech Assessment Methods Phonetic Alphabet) e i corrispondentivisemi per la lingua russa supportati da Amazon Polly.

75




Consonanti


борт p

bʲ b' occlusiva bilabialesonora palatalizzata

бюро p


дом t

dʲ d' occlusiva alveolaresonora palatalizzata

дядя t


флаг f

fʲ f' fricativa labiodentalepalatalizzata sorda

февраль f


нога k

ɡʲ g' occlusiva velaresonora palatalizzata

герой k


дизайн, ящик i


кот k

kʲ k' occlusiva velaresorda palatalizzata

кино k


лампа t

lʲ l' laterale alveolareapprossimantepalatalizzata

лес t

m m nasale bilabiale мама p

mʲ m' nasale bilabialepalatalizzata

мяч p

n n nasale alveolare нос t

nʲ n' nasale alveolarepalatalizzata

няня t


папа p

pʲ p' occlusiva bilabialesorda palatalizzata

перо p

76



r r vibrante alveolare роза r

rʲ r' vibrante alveolarepalatalizzata

рюмка r


сыр s

sʲ s' fricativa alveolaresorda palatalizzata

сердце, русь s

ɕ: s\: fricativaalveolopalatale sordaallungata

щека J


шум S


точка t

tʲ t' occlusiva alveolaresorda palatalizzata

тётя t


царь s


час J


вор f

vʲ v' fricativa labiodentalepalatalizzata sonora

верфь f

x x fricativa velare sorda хор k

xʲ x' fricativa velare sordapalatalizzata

химия k


зуб s

zʲ z' fricativa alveolaresonora palatalizzata

зима s

ʑ: z\: fricativaalveolopalatalesonora allungata

уезжать J

ʐ z` fricativa retroflessasonora

жена S

Vocali


канарейка @

77




два, яблоко a


печь e


это E


один, четыре i


кот o


муж, вьюга u


мышь i

Spagnolo (es-ES)La tabella seguente elenca i fonemi dell'alfabeto fonetico internazionale (International Phonetic Alphabet,IPA), i simboli X-SAMPA (Extended Speech Assessment Methods Phonetic Alphabet) e i corrispondentivisemi per la lingua spagnola supportati da Amazon Polly.



Consonanti


pero, bravo, amor,eterno

t


bestia p


bebé B


cuando t


arder T


fase, café f

78




gato, lengua, guerra k


trigo, Argos k


hacia, tierra, radio,viuda

i

ʝ j\ fricativa palatalesonora

enhielar, sayo,inyectado, desyerba

J


caña, laca, quisimos k


lino, calor, principal t


llave, pollo J

m m nasale bilabiale madre, comer,anfibio

p

n n nasale alveolare nido, anillo, sin t

ɲ J nasale palatale cabaña, ñoquis J

ŋ N nasale velare cinco, venga k


pozo, topo p

r r vibrante alveolare perro, enrachado r


saco, casa, puertas s


tamiz, átomo t


chubasco S


cereza, zorro, lacero,paz

T


fuego, fuimos, cuota,cuadro

u

x x fricativa velare sorda jamón, general, suje,reloj

k


rasgo, mismo s

Vocali

79




tanque a


peso e


cinco i


bosque o

u u vocale anterioresemichiusa nonarrotondata

publicar u


keçi e


dede e


bir i


izah i


keçi i


kıl i

o o vocale posterioresemichiusaarrotondata allungata

kol o


dolar o


durum u

80




ruhum u


dolu u

Y y vocale anteriorechiusa arrotondata

güvenlik u


aşı u

Simboli aggiuntivi




Spagnolo, Messico (es-MX)La tabella seguente elenca i fonemi dell'alfabeto fonetico internazionale (International Phonetic Alphabet,IPA), i simboli X-SAMPA (Extended Speech Assessment Methods Phonetic Alphabet) e i corrispondentivisemi per la lingua spagnola, Messico supportata da Amazon Polly.



Consonanti


pero, bravo, amor,eterno

t


bestia p


bebé B


cuando t


arder T


fase, café f


gato, lengua, guerra k

81




trigo, Argos k


hacia, tierra, radio,viuda

i

ʝ j\ fricativa palatalesonora

enhielar, sayo,inyectado, desyerba

J


caña, laca, quisimos k

l l alveolare lateraleapprossimante

lino, calor, principal t

m m nasale bilabiale madre, comer,anfibio

p

n n nasale alveolare nido, anillo, sin t

ɲ J nasale palatale cabaña, ñoquis J

ŋ N nasale velare angosto, increíble k


pozo, topo p

r r vibrante alveolare perro, enrachado r


saco, casa, puertas s


show, flash S


tamiz, átomo t


chubasco S


fuego, fuimos, cuota,cuadro

u

x x fricativa velare sorda jamón, general,peaje, reloj

k


rasgo, mismo s


Harrison k

ɹ r\ approssimantepostalveolare

Brian r


Vancouver f

82



Vocali

a a vocale apertacentrale nonarrotondata

tanque a


peso e


cinco i


bosque o


publicar u


dress E


Fort O


Lauderdale @

Simboli aggiuntivi




Spagnolo, Stati Uniti (es-US)La tabella seguente elenca i fonemi dell'alfabeto fonetico internazionale (International Phonetic Alphabet,IPA), i simboli X-SAMPA (Extended Speech Assessment Methods Phonetic Alphabet) e i corrispondentivisemi per la lingua spagnola americana supportati da Amazon Polly.


Consonanti

b b Occlusiva bilabialesonora

bed p

d d Occlusiva alveolaresonora

dig t

83



dʒ dZ Affricatapostalveolare sonora

jump S

ð D Fricativa dentalesonora

then T


five f


game k


house k

j j Approssimantepalatale

yes i

k k Occlusiva velaresorda

cat k

l l Laterale alveolareapprossimante

lay t

m m Nasale bilabiale mouse p

n n Nasale alveolare nap t

ŋ N Nasale velare thing k

p p Occlusiva bilabialesorda

speak p

ɹ r\ Approssimantealveolare

red r

s s Fricativa alveolaresorda

seem s

ʃ S Fricativapostalveolare sorda

ship S

t t Occlusiva alveolaresorda

trap t

tʃ tS Affricatapostalveolare sorda

chart S

Θ T Fricativa dentalesorda

thin T

v v Fricativa labiodentalesonora

vest f

w w Approssimantelabiovelare sonora

west u

z z Fricativa alveolaresonora

zero s

84



ʒ Z Fricativapostalveolare sonora

vision S

Vocali

ə @ Vocale centralemedia

arena @

ɚ @' Vocale centralemedia variante rotica

reader @

æ { Vocale anteriorequasi aperta nonarrotondata

trap a

aɪ aI Dittongo price a

aʊ aU Dittongo mouth a

ɑ A Vocale posterioreaperta nonarrotondata allungata

father a

eɪ eI Dittongo face e

ɝ 3` Vocale centralesemiaperta nonarrotondata versionerotica

nurse E

ɛ E Vocale anterioresemiaperta nonarrotondata

dress E

i: i Vocale anteriorechiusa nonarrotondata allungata

fleece i

ɪ I Vocale quasianteriore quasichiusa nonarrotondata

kit i

oʊ oU Dittongo goat o

ɔ O Vocale posterioresemiapertaarrotondata allungata

thought O


u u Vocale posteriorechiusa arrotondataallungata

goose u

ʊ U Vocale quasiposteriore quasichiusa arrotondata

foot u

85




strut E

Simboli aggiuntivi




Svedese (sv-SE)La tabella seguente elenca i fonemi dell'alfabeto fonetico internazionale (International Phonetic Alphabet,IPA), i simboli X-SAMPA (Extended Speech Assessment Methods Phonetic Alphabet) e i corrispondentivisemi per la lingua svedese supportati da Amazon Polly.



Consonanti


bil p


dal t

ɖ d` occlusiva retroflessasonora

bord t


fil f


gås k


hal k


jag i


kal k


lös t

ɭ l` approssimantelaterale retroflessa

härlig t

m m nasale bilabiale mil p

n n nasale alveolare nålar t

86



ɳ n` nasale retroflessa barn t

ŋ N nasale velare ring k


pil p

r r vibrante alveolare ris r


sil s


tjock J


fors, schlager S


tal t

ʈ t` occlusiva retroflessasorda

hjort t


vår f


aula, airways u

ɧ x\ fricativa velarepalatale sorda

sjuk k

Vocali


föll, förr o

ø 2: vocale anterioresemichiusaarrotondata allungata

föl, nöt, för o

ɵ 8 vocale centralesemichiusaarrotondata

buss, full o


pojken @

ʉː }: vocale centralechiusa arrotondataallungata

hus, ful u


hall, matt a

87




herr a


hal, mat a


vet, hel e


vett, rätt, hetta, häll E

ɛː E: vocale anterioresemiaperta nonarrotondata allungata

säl, häl, här E:


vit, sil i:


vitt, sill i


hål, mål o


håll, moll O


sol, bot u


bott u


bytt u


syl, syl u

Simboli aggiuntivi



88




Turco (tr-TR)La tabella seguente elenca i fonemi dell'alfabeto fonetico internazionale (International Phonetic Alphabet,IPA), i simboli X-SAMPA (Extended Speech Assessment Methods Phonetic Alphabet) e i corrispondentivisemi per la lingua turca supportati da Amazon Polly.



Consonanti


durum t

ɾ 4_0_r monovibranteaffricata alveolaresorda

bir t

ɾ 4_r monovibrantealveolare affricata

raf t


raf p


kedi k


dede t


cam S


fare f


galibi k


hasta k


yat i

ɟ J\ occlusiva palatalesonora

genç J


akıl k


lale t

89



ɫ 5 laterale alveolareapprossimantevelarizzata

labirent t

m m nasale bilabiale maaş p

n n nasale alveolare anı t


ip p


ses s


aşı S


ütü t


çaba S


ekvator, kahveci,akvaryum, isveçli,teşviki, cetvel

f


ver s


azık S

Vocali


göl 0


banliyö O


kal a


davacı a


özlem, güvenlik,gürel, somersault

a


keçi e

90




dede E


bir i


izah i


keçi i


kıl i


kol o


dolar o


durum u


ruhum u


dolu u


güvenlik u


aşı u

Simboli aggiuntivi




91


Gallese (cy-GB)La tabella seguente elenca i fonemi dell'alfabeto fonetico internazionale (International Phonetic Alphabet,IPA), i simboli X-SAMPA (Extended Speech Assessment Methods Phonetic Alphabet) e i corrispondentivisemi per la lingua gallese supportati da Amazon Polly.



Consonanti


baban p


deg t


garej S


deuddeg T


ffacs f


gadael k


haearn k


astudio i


cant k


lan t

ɬ K fricativa alveolarelaterale sorda

llan t

m m nasale bilabiale mae p

m m_0 Nasale bilabialesorda

ymhen p

n n nasale alveolare naw t

n n_0 Nasale alveolaresorda

anhawster t

ŋ N nasale velare argyfwng k

ŋ N_0 Nasale velare sorda anghenion k


pump p

92



r r vibrante alveolare rhoi r

r r_0 Vibrante alveolaresorda

garw r


saith s


siawns S


tegan t


cytsain S


aberth T


prawf f


rhagweld u

χ X fricativa uvularesorda

chwech k


aids s


rouge S

Vocali


ychwanega @


acen a

ai ai dittongo dau a

au au dittongo awdur a


mab a

ɑːɨ A:1 dittongo aelod a


peth e

93




pedwar E

ɛi Ei dittongo beic E


tri i


miliwn i

ɨu 1u dittongo unigryw i


oddi o


oddieithr O

ɔi Oi dittongo troi O

ɔu Ou dittongo rownd O


cwch u


acwstig u

ʊi Ui dittongo wyth u

Simboli aggiuntivi




94

Amazon Polly Developer GuideCaratteristiche e compatibilità delle regioni

Neural TTSAmazon Polly dispone di un sistema Neural TTS (NTTS) in grado di produrre voci di qualità ancora piùelevata rispetto alle voci standard. Il sistema NTTS produce voci di sintesi vocale più naturali e simili aquelle umane.

Le voci TTS standard utilizzano la sintesi concatenativa. Questo metodo unisce (concatena) i fonemi dellasintesi vocale registrata, producendo una sintesi vocale dal suono molto naturale. Tuttavia, le inevitabilivariazioni della voce e le tecniche utilizzate per segmentare le forme d'onda limitano la qualità della voce.

Il sistema Amazon Polly Neural TTS non utilizza la sintesi concatenativa standard per produrre la sintesivocale. È costituito da due parti:

• Una rete neurale che converte una sequenza di fonemi, le unità di base della lingua, in una sequenza dispettrogrammi, ovvero snapshot dei livelli di energia in diverse bande di frequenza.

• Un vocoder che converte gli spettrogrammi in un segnale audio continuo.

Il primo componente del sistema Neural TTS è un modello da sequenza a sequenza. Questo modello noncrea i risultati solo dall'input corrispondente, ma tiene in considerazione anche il modo in cui interagisce lasequenza degli elementi dell'input. Il modello sceglie gli spettrogrammi che emette in modo che le bande difrequenza enfatizzino le caratteristiche acustiche che il cervello umano utilizza durante l'elaborazione dellasintesi vocale.

L'output di questo modello passa quindi a un vocoder neurale che converte gli spettrogrammi in formed'onda della sintesi vocale. Quando viene addestrato sui set di dati di grandi dimensioni utilizzati per crearesistemi di sintesi concatenativa per scopi generici, questo approccio da sequenza a sequenza produce vocidi qualità più elevata e con un suono più naturale.

Ad eccezione della voce di Kevin (inglese Stati Uniti, en-US), tutte le voci NTTS hanno anche unacontroparte creata utilizzando il metodo TTS standard. La voce di Kevin è supportata solo da Amazon Pollyquando si utilizza NTTS. Quando si utilizza la voce di Kevin (o qualsiasi altra voce solo NTTS), il parametrodel motore TTS deve essere impostato su neural, sia che si utilizzi la console o l'API.

Argomenti• Caratteristiche e compatibilità delle regioni (p. 95)• Il motore vocale (p. 96)• Voci neurali (p. 98)• Stili di pronuncia NTTS (p. 99)

Caratteristiche e compatibilità delle regioniLe voci neurali non sono disponibili in tutte le regioni AWS, né supportano tutte le caratteristiche AmazonPolly.

Le voci neurali sono supportate nelle seguenti regioni:

• Stati Uniti orientali (Virginia settentrionale): us-east-1• Stati Uniti occidentali (Oregon): us-west-2• UE (Irlanda): eu-west-1• Asia Pacifico (Sydney): ap-southeast-2

95

Amazon Polly Developer GuideIl motore vocale

Gli endpoint e i protocolli per queste regioni sono identici a quelli utilizzati per le voci standard. Per ulterioriinformazioni, consulta Regioni ed endpoint.

Le seguenti caratteristiche sono supportate per le voci neurali:

• Operazioni di sintesi vocale asincrona e in tempo reale.• Stili di pronuncia per la narrazione di notizie (Newscaster) e per la conversazione (Conversational). (Per

ulteriori informazioni sugli stili di pronuncia, consultare Stili di pronuncia NTTS (p. 99).)• Tutti i contrassegni vocali.• Molti (ma non tutti) i tag SSML supportati da Amazon Polly. Per ulteriori informazioni sui tag SSML

supportati da NTTS, consulta Tag SSML supportati (p. 116).

Come per le voci standard, puoi scegliere tra diverse frequenze di campionamento per ottimizzare lalarghezza di banda e la qualità audio della tua applicazione. Le frequenze di campionamento valide per levoci standard e neurali sono 8 kHz, 16 kHz, 22 kHz o 24 kHz. Il valore predefinito per le voci standard è 22kHz. Il valore predefinito per le voci neurali è 24 kHz. Amazon Polly supporta i formati di flusso audio MP3,OGG (Vorbis) e PCM raw.

Il motore vocaleAmazon Polly consente di utilizzare la voce neurale o standard con la proprietà engine. Ha due valoripossibili, Standard o Neural, che indicano se utilizzare una voce standard o neurale. Standard è il valorepredefinito.

Se non ti trovi in una delle quattro regioni in cui è supportato NTTS, nella console viene visualizzato soloil motore vocale standard. Se il motore neurale non viene visualizzato, controlla la regione. Per ulterioriinformazioni sulle regioni in cui è possibile utilizzare NTTS, consulta Caratteristiche e compatibilità delleregioni (p. 95).

Quando si utilizza la voce di Kevin (o qualsiasi altra voce solo NTTS), il parametro del motore TTS deveessere impostato su neural, sia che si utilizzi la console o l'API.

Scelta del motore vocale (console)Per scegliere un motore vocale (console)

1. Aprire la console Amazon Polly all'indirizzo https://console.aws.amazon.com/polly/.2. Nella pagina Text-to-Speech (Sintesi vocale), per Engine (Motore), scegliere Standard o Neural

(Neurale).

96

https://docs.aws.amazon.com/general/latest/gr/rande.html#pol_region


Amazon Polly Developer GuideScelta del motore vocale (console)

97

Amazon Polly Developer GuideScelta del motore vocale (CLI)

Se si sceglie Neural (Neurale), solo le voci neurali sono disponibili e solo quelle standard sonodisabilitate.

Scelta del motore vocale (CLI)Per scegliere un motore vocale (CLI)

Il parametro engine è facoltativo e ha due valori possibili: standard o Neural. Utilizza questa proprietàdurante la creazione di un'operazione SynthesisSynthesisTask.

Ad esempio, puoi utilizzare il codice seguente per eseguire il comando start-speech-synthesis-task dell'interfaccia a riga di comando di AWS nella regione Stati Uniti occidentali-2 (Oregon).


aws polly start-speech-synthesis-task \ --engine neural --region us-west-2 \ --endpoint-url "https://polly.us-west-1.amazonaws.com/" \ --output-format mp3 \ --output-s3-bucket-name your-bucket-name \ --output-s3-key-prefix optional/prefix/path/file \ --voice-id Joanna \ --text file://text_file.txt

Questo determinerà una risposta simile a questa:

"SynthesisTask": { "CreationTime": [..], "Engine": "neural", "OutputFormat": "mp3", "OutputUri": "https://s3.us-west-1.amazonaws.com/your-bucket-name/optional/prefix/path/file.<task_id>.mp3", "TextType": "text", "RequestCharacters": [..], "TaskStatus": "scheduled", "TaskId": [task_id], "VoiceId": "Joanna" }

Voci neuraliLe voci neurali sono disponibili in inglese Stati Uniti (en-US), inglese britannico (en-GB), portoghesebrasiliano (pt-BR) e spagnolo Stati Uniti (es-US). Le voci sono elencate nella tabella seguente.

Lingua Nome/ID Sesso

Inglese (Regno Unito) (en-GB) Amy

Emma

Brian

Femmina

Femmina

Maschio

98

Amazon Polly Developer GuideStili di pronuncia NTTS

Lingua Nome/ID Sesso

Inglese (Stati Uniti) (en-US) Ivy

Joanna*

Kendra

Kimberly

Salli

Joey

Justin

Kevin**

Matthew*

Femmina (bambina)

Femmina

Femmina

Femmina

Femmina

Maschio

Maschio (bambino)

Maschio (bambino)

Maschio

Portoghese (Brasile) (pt-BR) Camila Femmina

Spagnolo, Stati Uniti (es-US) Lupe* Femmina

Le voci di Matthew e Joanna possono essere utilizzate con gli stili di pronuncia Newscaster eConversational. La voce di Lupe può essere utilizzata con lo stile di pronuncia Newscaster. Per ulterioriinformazioni, consulta Stili di pronuncia NTTS (p. 99).

**La voce di Kevin è disponibile solo in NTTS e non come voce standard.

Stili di pronuncia NTTSLe persone utilizzano stili di pronuncia diversi, a seconda del contesto. Le conversazioni occasionali, adesempio, sembrano molto diverse dai notiziari televisivi o radiofonici. Quando Amazon Polly sintetizza lasintesi vocale utilizzando voci standard, utilizza il metodo concatenativo. Il metodo concatenativo unisceframmenti vocali brevi archiviati in un database audio per produrre la sintesi vocale più ottimale e naturalepossibile. Tuttavia, a causa del modo in cui queste voci sono composte, non possono produrre stili diconversazione diversi.

Oltre alla sintesi concatenativa standard, Amazon Polly può utilizzare la tecnologia neurale per produrreil linguaggio. Amazon Polly genera voci neurali utilizzando un modello da sequenza a sequenza. Questomodello produce risultati che utilizzano l'input dei dati audio per formare la voce e considera anche la suaposizione nella sequenza degli output. Può quindi essere usato come una voce molto naturale così com'èo può essere addestrato per uno stile di conversazione specifico, con le variazioni e l'enfasi su alcune partidel discorso inerenti a quello stile.

Amazon Polly fornisce due stili di conversazione che è possibile utilizzare: Newscaster e Conversational.

Lo stile Newscaster utilizza il sistema neurale per generare la sintesi vocale nello stile di un conduttoretelevisivo o radiofonico. Lo stile Newscaster è disponibile con le voci Matthew e Joanna, in inglese StatiUniti (en-US), e la voce Lupe, in spagnolo Stati Uniti (es-US).

Lo stile Conversational utilizza il sistema neurale per generare un discorso in uno stile di conversazione piùamichevole ed espressivo che può essere utilizzato in molti casi d'uso. Lo stile Conversational è disponibilesolo per le voci di Matthew e Joanna, che sono solo in inglese Stati Uniti (en-US).

Argomenti

99

Amazon Polly Developer GuideUtilizzo dello stile newscaster

• Utilizzo dello stile newscaster (p. 100)• Utilizzo dello stile Conversational (p. 101)

Utilizzo dello stile newscasterLo stile Newscaster è disponibile solo per le voci di Matthew e Joanna, utilizzando il motore neurale. Perutilizzare lo stile Newscaster, scegliere innanzitutto il motore neurale e quindi utilizzare nel testo di input lasintassi descritta nelle fasi seguenti.

Note

Per utilizzare qualsiasi stile di linguaggio neurale, è necessario utilizzare una delle regioni AWSche supportano le voci neurali. Questa opzione non è disponibile in tutte le regioni. Per ulterioriinformazioni, consulta Caratteristiche e compatibilità delle regioni (p. 95).

Per applicare lo stile newscaster (console)

1. Aprire la console Amazon Polly all'indirizzo https://console.aws.amazon.com/polly/.2. Assicurarsi di utilizzare una regione AWS in cui siano supportate le voci neurali.3. Nella pagina Text-to-Speech (Sintesi vocale), per Engine (Motore), scegliere Neural (Neurale).4. Scegli la lingua e la voce che vuoi usare.

Solo Matthew e Joanna per l'inglese Stati Uniti (en-US) e Lupe per lo spagnolo Stati Uniti (es-US) sonodisponibili per la voce newscaster.

5. Seleziona la scheda SSML.6. Aggiungere il testo di input alla richiesta di sintesi vocale utilizzando la sintassi SSML in stile

Newscaster.

<amazon:domain name="news">text</amazon:domain>

Ad esempio, è possibile utilizzare il tag newscaster come segue:

<speak> <amazon:domain name="news"> From the Tuesday, April 16th, 1912 edition of The Guardian newspaper:

The maiden voyage of the White Star liner Titanic, the largest ship ever launched ended in disaster.

The Titanic started her trip from Southampton for New York on Wednesday. Late on Sunday night she struck an iceberg off the Grand Banks of Newfoundland. By wireless telegraphy she sent out signals of distress, and several liners were near enough to catch and respond to the call.</amazon:domain> </speak>

7. Scegliere Ascolta sintesi vocale.

Per applicare lo stile newscaster (CLI)

1. Nella richiesta API, includere il parametro del motore con il valore neural:

--engine neural

2. Aggiungere il testo di input alla richiesta API utilizzando la sintassi SSML in stile Newscaster.

100


Amazon Polly Developer GuideUtilizzo dello stile Conversational


Ad esempio, è possibile utilizzare il tag newscaster come segue:


The maiden voyage of the White Star liner Titanic, the largest ship ever launched ended in disaster.


Per ulteriori informazioni su SSML, consulta Tag SSML supportati (p. 116).

Utilizzo dello stile ConversationalLo stile Conversational è disponibile solo quando si utilizza il motore neurale per le voci di Matthew eJoanna in inglese Stati Uniti (en-US). Per utilizzare lo stile Conversational, scegliere innanzitutto il motoreneurale e quindi utilizzare nel testo di input la sintassi descritta nelle fasi seguenti.

Note

Per utilizzare qualsiasi stile di linguaggio neurale, è necessario utilizzare una delle regioni AWSche supportano le voci neurali. Questa opzione non è disponibile in tutte le regioni. Per ulterioriinformazioni, consulta Caratteristiche e compatibilità delle regioni (p. 95).

Per applicare lo stile Conversational (console)

1. Aprire la console Amazon Polly all'indirizzo https://console.aws.amazon.com/polly/.2. Assicurarsi di utilizzare una regione AWS in cui siano supportate le voci neurali.3. Nella pagina Text-to-Speech (Sintesi vocale), per Engine (Motore), scegliere Neural (Neurale).4. Seleziona la scheda SSML.5. Aggiungere il testo di input alla richiesta di sintesi vocale utilizzando la sintassi SSML in stile

Conversational.

Per applicare lo stile Conversational (CLI)

1. Nella richiesta API, includere il parametro del motore con il valore neural:

--engine neural

2. Aggiungere il testo di input alla richiesta API utilizzando la sintassi SSML in stile Conversational.

Utilizzare il seguente SSML in stile Conversational nel file di input.

<amazon:domain name="conversational">text</amazon:domain>

101


Amazon Polly Developer GuideUtilizzo dello stile Conversational

Ad esempio, è possibile utilizzare il tag di conversazione con la voce Matthew o Joanna nella seguentecitazione di H.G. Wells dal romanzo La guerra dei mondi:

<speak> <amazon:domain name="conversational">No one would have believed in the last years of the nineteenth century that this world was being watched keenly and closely by intelligences greater than man's and yet as mortal as his own; that as men busied themselves about their various concerns they were scrutinised and studied perhaps almost as narrowly as a man with a microscope might scritinise the transient creatures that swarm and multiply in a drop of water.</amazon:domain> </speak>

Per ulteriori informazioni su SSML, consulta Tag SSML supportati (p. 116).

102

Amazon Polly Developer GuideTipi di contrassegni vocali

Contrassegni vocaliI contrassegni vocali sono metadata che descrivono la sintesi vocale, ad esempio il punto in cui una fraseo parola inizia e finisce nel flusso audio. Quando richiedi contrassegni vocali per il tuo testo, Amazon Pollyrestituisce questi metadati anziché la sintesi vocale. Utilizzando i contrassegni vocali in combinazione con ilflusso audio della sintesi vocale, è possibile offrire alle tue applicazioni un'esperienza visiva ottimizzata.

Ad esempio, la combinazione di metadata con il flusso audio del tuo testo consente di sincronizzare lasintesi vocale con animazioni del volto (sincronia labiale) o di evidenziare le parole scritte appena vengonopronunciate.

I contrassegni vocali sono disponibili quando si utilizzano i formati di sintesi vocale neurali o standard.

Argomenti• Tipi di contrassegni vocali (p. 103)• Utilizzo dei contrassegni vocali (p. 104)• Richiesta di contrassegni vocali (console) (p. 107)

Tipi di contrassegni vocaliPuoi richiedere contrassegni vocali mediante l'opzione SpeechMarkTypes per il comandoSynthesizeSpeech o StartSpeechSynthesisTask. Vengono specificati gli elementi di metadata che desiderivengano restituiti dal testo di input. Puoi richiedere quattro tipi di metadata ma devi specificarne almenouno per richiesta. Non viene generato alcun output audio con la richiesta.

Nell'interfaccia a riga di comando AWS, ad esempio:

--speech-mark-types='["sentence", "word", "viseme", "ssml"]'

Amazon Polly genera contrassegni vocali utilizzando i seguenti elementi:

• sentence (frase) – Indica un elemento frase nel testo di input.• word (parola) – Indica un elemento parola nel testo di input.• viseme (visema) – Descrive i movimenti di volto e bocca corrispondenti a ciascun fonema pronunciato.

Per ulteriori informazioni, consulta Visemi e Amazon Polly (p. 103).• ssml – Descrive un elemento <mark> del testo di input SSML. Per ulteriori informazioni, consulta

Generazione di input vocale da documenti SSML (p. 109).

Visemi e Amazon PollyUn visema rappresenta la posizione del volto e della bocca quando si pronuncia una parola. È l'equivalentevisivo di un fonema, vale a dire l'unità acustica di base da cui è formata una parola. I visemi sono glielementi costitutivi visivi di base della lingua parlata.

Ogni lingua ha una serie di visemi che corrispondono ai rispettivi fonemi specifici. In una lingua, a ciascunfonema corrisponde un visema che rappresenta la forma delineata dalla bocca nel formare il suono.Tuttavia, non tutti i visemi possono essere mappati a un determinato fonema perché numerosi fonemiappaiono identici quando pronunciati, sebbene il suono sia diverso. Ad esempio, in inglese, i termini "pet"

103

https://docs.aws.amazon.com/polly/latest/dg/API_StartSpeechSynthesisTask.html#polly-StartSpeechSynthesisTask-request-SpeechMarkTypes

https://docs.aws.amazon.com/polly/latest/dg/API_SynthesizeSpeech.html

https://docs.aws.amazon.com/polly/latest/dg/API_StartSpeechSynthesisTask.html

Amazon Polly Developer GuideUtilizzo dei contrassegni vocali

e "bet" sono acusticamente differenti. Tuttavia, quando osservati visivamente (senza suono), sembranoidentici.

Nel grafico seguente viene visualizzato un elenco parziale dei fonemi dell'alfabeto fonetico internazionale(IPA) e dei simboli dell'alfabeto X-SAMPA (Extended Speech Assessment Methods Phonetic Alphabet),nonché i visemi corrispondenti per le voci inglesi degli Stati Uniti.

Per la tabella completa e le tabelle per tutte le lingue disponibili, consultare Tabelle fonemi e visemi per lelingue supportate (p. 19).


Consonanti

b b Occlusiva bilabialesonora

bed p

d d Occlusiva alveolaresonora

dig t

dʒ dZ Affricatapostalveolare sonora

jump S

ð D Fricativa dentalesonora

then T


five f


game k


house k

... ... ... ... ...

Utilizzo dei contrassegni vocaliRichiesta di contrassegni vocaliPer richiedere contrassegni vocali per il testo di input, utilizza il comando synthesize-speech. Oltre altesto di input, sono necessari i seguenti elementi affinché vengano restituiti questi metadata:

• output-format

Amazon Polly supporta solo il formato JSON quando restituisce i contrassegni vocali.

--output-format json

Se utilizzi un formato di output non supportato, Amazon Polly genera un'eccezione.• voice-id

Per garantire che i metadata corrispondano al flusso audio associato, specifica la stessa voceutilizzata per generare il flusso audio della sintesi vocale. Le voci disponibili non hanno velocità

104

Amazon Polly Developer GuideOutput dei contrassegni vocali

identiche. Se utilizzi una voce diversa da quella utilizzata per generare la sintesi vocale, i metadata noncorrisponderanno al flusso audio.

--voice-id Joanna

• speech-mark-types

Specifica il tipo o i tipi di contrassegni vocali desiderati. Puoi richiedere alcuni o tutti i tipi di contrassegnivocali, ma devi specificare almeno un tipo.

--speech-mark-types='["sentence", "word", "viseme", "ssml"]'

• text-type

Il testo semplice è il testo di input predefinito per Amazon Polly, perciò devi utilizzare text-type ssmlse desideri che vengano restituiti contrassegni vocali SSML.

• outfile

Specifica il file di output in cui sono scritti i metadata.

MaryLamb.txt


aws polly synthesize-speech \ --output-format json \ --voice-id Voice ID \ --text 'Input text' \ --speech-mark-types='["sentence", "word", "viseme"]' \ outfile

Output dei contrassegni vocaliAmazon Polly restituisce gli oggetti di contrassegni vocali in un flusso JSON delimitato da righe. Un oggettodi contrassegno vocale contiene i seguenti campi:

• time (tempo) – Il timestamp in millisecondi dall'inizio del flusso audio corrispondente• type (tipo) – Il tipo di contrassegno vocale (frase, parola, visema o ssml)• start (inizio) – Lo spostamento in byte (non caratteri) dell'inizio dell'oggetto nel testo di input (non include i

contrassegni visema)• end (fine) – Lo spostamento in byte (non caratteri) della fine dell'oggetto nel testo di input (non include i

contrassegni visema)• value (valore) – Varia a seconda del tipo di contrassegno vocale

• SSML: tag SSML <mark>• viseme (visema): nome del visema• word (parola) o sentence (frase): una sottostringa del testo di input delimitata dai campi di inizio e fine

Ad esempio, Amazon Polly genera il seguente oggetto di contrassegno vocale word dal testo "Mary had alittle lamb":

105

Amazon Polly Developer GuideEsempi di contrassegni vocali

{"time":373,"type":"word","start":5,"end":8,"value":"had"}

La parola descritta ("had") comincia 373 millisecondi dopo l'inizio del flusso audio, nonché inizia al byte 5 efinisce al byte 8 del testo di input.

Note

Questi metadata sono relativi all'ID vocale Joanna. Se utilizzi un'altra voce con lo stesso testo diinput, i metadata possono variare.

Esempi di contrassegni vocaliI seguenti esempi di richieste di contrassegni vocali mostrano come effettuare richieste comuni e l'outputgenerato.

Esempio 1: Contrassegni vocali senza SSMLL'esempio seguente mostra l'aspetto dei metadata richiesti sullo schermo per la frase semplice: "Mary hada little lamb". Per semplicità, non sono inclusi contrassegni vocali SSML in questo esempio.


aws polly synthesize-speech \ --output-format json \ --voice-id Joanna \ --text 'Mary had a little lamb.' \ --speech-mark-types='["viseme", "word", "sentence"]' \ MaryLamb.txt

Quando si effettua questa richiesta, Amazon Polly restituisce i seguenti elementi nel file .txt:

{"time":0,"type":"sentence","start":0,"end":23,"value":"Mary had a little lamb."}{"time":6,"type":"word","start":0,"end":4,"value":"Mary"}{"time":6,"type":"viseme","value":"p"}{"time":73,"type":"viseme","value":"E"}{"time":180,"type":"viseme","value":"r"}{"time":292,"type":"viseme","value":"i"}{"time":373,"type":"word","start":5,"end":8,"value":"had"}{"time":373,"type":"viseme","value":"k"}{"time":460,"type":"viseme","value":"a"}{"time":521,"type":"viseme","value":"t"}{"time":604,"type":"word","start":9,"end":10,"value":"a"}{"time":604,"type":"viseme","value":"@"}{"time":643,"type":"word","start":11,"end":17,"value":"little"}{"time":643,"type":"viseme","value":"t"}{"time":739,"type":"viseme","value":"i"}{"time":769,"type":"viseme","value":"t"}{"time":799,"type":"viseme","value":"t"}{"time":882,"type":"word","start":18,"end":22,"value":"lamb"}{"time":882,"type":"viseme","value":"t"}{"time":964,"type":"viseme","value":"a"}{"time":1082,"type":"viseme","value":"p"}

In questo output, ogni parte del testo è suddivisa a livello di contrassegni vocali:

106

Amazon Polly Developer GuideRichiesta di contrassegni vocali (console)

• La frase "Mary had a little lamb".• Ogni parola del testo: "Mary", "had", "a", "little" e "lamb".• Il visema di ogni suono nel flusso audio corrispondente: "p", "E", "r", "i" e così via. Per ulteriori

informazioni sui visemi, consulta Visemi e Amazon Polly (p. 103).

Esempio 2: Contrassegni vocali con SSMLIl processo di generazione dei contrassegni vocali da un testo ottimizzato per SSML è analogo al processoutilizzato quando SSML non è presente. Utilizza il comando synthesize-speech e specifica il testoottimizzato per SSML e il tipo di contrassegni vocali che desideri, come mostrato nell'esempio seguente.Affinché l'esempio sia più facile da leggere, non sono inclusi i contrassegni vocali dei visemi, tuttavia sipotrebbero anche includere.


aws polly synthesize-speech \ --output-format json \ --voice-id Joanna \ --text-type ssml \ --text '<speak><prosody volume="+20dB">Mary had <break time="300ms"/>a little <mark name="animal"/>lamb</prosody></speak>' \ --speech-mark-types='["sentence", "word", "ssml"]' \ output.txt

Quando si effettua questa richiesta, Amazon Polly restituisce i seguenti elementi nel file .txt:

{"time":0,"type":"sentence","start":31,"end":95,"value":"Mary had <break time=\"300ms\"\/>a little <mark name=\"animal\"\/>lamb"}{"time":6,"type":"word","start":31,"end":35,"value":"Mary"}{"time":325,"type":"word","start":36,"end":39,"value":"had"}{"time":897,"type":"word","start":40,"end":61,"value":"<break time=\"300ms\"\/>"}{"time":1291,"type":"word","start":61,"end":62,"value":"a"}{"time":1373,"type":"word","start":63,"end":69,"value":"little"}{"time":1635,"type":"ssml","start":70,"end":91,"value":"animal"}{"time":1635,"type":"word","start":91,"end":95,"value":"lamb"}

Richiesta di contrassegni vocali (console)La console consente di richiedere contrassegni vocali da Amazon Polly. Puoi quindi visualizzare i metadatao salvarli in un file.

Per generare i contrassegni vocali (console)


2. Scegli la scheda Text-to-Speech (Sintesi vocale).3. Continua a utilizzare la scheda Plain Text (Testo semplice) oppure scegli la scheda SSML.4. Digita o incolla il testo nella casella di input.5. Per Language and region (Lingua e regione), scegli la lingua del testo.6. Per Voice (Voce), scegli la voce che desideri utilizzare per il testo.

107



Amazon Polly Developer GuideRichiesta di contrassegni vocali (console)

7. Per modificare la pronuncia del testo, scegli Customize Pronunciation (Personalizza pronuncia) e inApply Lexicon (Applica lessico) scegli il lessico desiderato.

8. Per verificare che la sintesi vocale sia nella forma finale, scegli Listen to speech (Ascolta sintesivocale).

9. Scegli Change File Format (Modifica formato di file).

Note

Il download dei formati MP3, OGG o PCM non genererà contrassegni vocali.10. In File Format (Formato file), scegli Speech Marks (Contrassegni vocali).11. In Speech Mark Types (Tipi di contrassegni vocali), scegli i tipi di contrassegni vocali da generare.

L'opzione per la scelta dei metadata SSML è disponibile solo nella scheda SSML. Per ulterioriinformazioni sull'utilizzo di SSML con Amazon Polly, consulta Generazione di input vocale dadocumenti SSML (p. 109).

12. Scegli Change (Cambia).13. Scegli Download Speech Marks (Scarica contrassegni vocali).

108

Amazon Polly Developer GuideCaratteri riservati

Generazione di input vocale dadocumenti SSML

È possibile utilizzare Amazon Polly per generare input vocale da testo semplice o documenti contrassegnaticon Speech Synthesis Markup Language (SSML). L'utilizzo di testo ottimizzato per SSML fornisce ulteriorecontrollo sul modo in cui Amazon Polly genera la sintesi vocale dal testo fornito.

Ad esempio, è possibile includere una lunga pausa all'interno del testo o cambiando la velocità ol'intonazione della sintesi vocale. Altre opzioni includono:

• enfatizzare parole o frasi specifiche• utilizzare la pronuncia fonetica• includere i suoni respiratori• sussurrare• utilizzare lo stile di pronuncia newscaster.

Per dettagli completi sui tag SSML supportati da Amazon Polly e su come utilizzarli, consulta Tag SSMLsupportati (p. 116)

Quando si utilizza SSML, ci sono diversi caratteri riservati che richiedono un trattamento speciale. Questoperché SSML utilizza questi caratteri come parte del suo codice. Per utilizzarli, usa un'entità specifica comecarattere di escape. Per ulteriori informazioni, consulta Caratteri riservati in SSML (p. 109)

Amazon Polly fornisce questo tipo di controllo con un sottoinsieme di tag di markup SSML definiti daSpeech Synthesis Markup Language (SSML) versione 1.1, specifiche W3C.

È possibile utilizzare SSML nella console di Amazon Polly o tramite AWS CLI. I seguenti argomentiillustrano come è possibile utilizzare SSML per generare discorso e controllare l'output in modo cherisponda precisamente alle tue esigenze.

Argomenti• Caratteri riservati in SSML (p. 109)• Utilizzo di SSML (Console) (p. 111)• Utilizzo di SSML (AWS CLI) (p. 112)• Tag SSML supportati (p. 116)

Caratteri riservati in SSMLEsistono cinque caratteri predefiniti che normalmente non possono essere utilizzati all'interno diun'istruzione SSML. Queste entità sono riservate dalla specifica della lingua. Questi caratteri sono

Nome Carattere Codicediescape

virgolette(virgolettedoppie)

""

109

https://www.w3.org/TR/2010/REC-speech-synthesis11-20100907/

Amazon Polly Developer GuideCaratteri riservati

Nome Carattere Codicediescape

ecommerciale&&

apostrofoovirgolettesingole

''

segnominoredi

<<

segnomaggioredi

>>

Poiché SSML utilizza questi caratteri come parte del suo codice, per usare questi simboli in SSML, deviinserire un carattere di escape. Puoi utilizzare il codice di escape anziché il carattere effettivo in modo chevenga visualizzato correttamente durante la creazione di un documento SSML valido. Ad esempio, la fraseseguente

We're using the lawyer at Peabody & Chambers, attorneys-at-law.

verrà sottoposta al rendering in SSML come

<speak>We're using the lawyer at Peabody & Chambers, attorneys-at-law.</speak>

In questo caso, i caratteri speciali per l'apostrofo e la e commerciale sono preceduti da un carattere diescape, in modo che il documento SSML rimanga valido.

Per i simboli &, < e >, i codici di escape sono sempre necessari quando utilizzi SSML. Inoltre, anchequando usi l'apostrofo o la virgoletta singola (') come apostrofo, è necessario utilizzare il codice di escape.

Tuttavia, quando utilizzi le virgolette doppie (") oppure l'apostrofo o la virgoletta singola (') come virgoletta,l'eventuale utilizzo del codice di escape dipende dal contesto.

Virgolette doppie

• Devono essere precedute da un carattere di escape quando si trovano in un valore di attributo delimitatoda virgolette doppie. Ad esempio, nel seguente codice AWS CLI

--text "Pete "Maverick" Mitchell"

• Non è necessario specificare il carattere di escape nel contesto testuale, come nell'esempio seguente

He said, "Turn right at the corner."

• Non è necessario specificare il carattere di escape quando sono in un valore di attributo delimitato davirgolette singole. Ad esempio, nel seguente codice AWS CLI

110

Amazon Polly Developer GuideUtilizzo di SSML nella console

--text 'Pete "Maverick" Mitchell'

Virgolette singole

• Devono essere precedute da un carattere di escape quando vengono utilizzate come apostrofo, comenell'esempio seguente

We've got to leave quickly.

• Non è necessario specificare il carattere di escape nel contesto testuale, come nell'esempio seguente

"And then I said, 'Don't quote me.'"

• Non è necessario inserire il carattere di escape quando si trovano in un attributo di codice delimitato davirgolette doppie. Ad esempio, nel seguente codice AWS CLI

--text "Pete 'Maverick' Mitchell"

Utilizzo di SSML (Console)Con i tag SSML, è possibile personalizzare e controllare diversi aspetti del discorso restituito, ad esempiopronuncia, volume e velocità. Nella Console AWS, il testo ottimizzato per SSML che si desidera convertirein audio viene inserito nella scheda SSML della pagina di sintesi vocale. Sebbene il testo inserito cometesto normale si basi su impostazioni predefinite per la lingua e la voce scelte, il testo ottimizzato per SSMLcomunica a Amazon Polly non solo ciò che si desidera dire, ma anche il modo in cui dirlo. Ad eccezionedell'aggiunta dei tag SSML, Amazon Polly sintetizza il testo ottimizzato per SSML nello stesso modo in cuisintetizza il testo normale. Per ulteriori informazioni, consulta Esercizio 2: sintesi vocale con input di testonormale (console) (p. 6).

Quando si utilizza SSML, l'intero testo viene racchiuso in un tag <speak> per comunicare a Amazon Pollyche si sta utilizzando SSML. Ad esempio:

<speak>Hi! My name is Joanna. I will read any text you type here.</speak>

Si possono quindi utilizzare tag SSML specifici sul testo all'interno dei tag <speak> per personalizzareil modo in cui si desidera che il testo suoni. È possibile aggiungere una pausa, modificare il ritmo deldiscorso, ridurre o aumentare il volume della voce o aggiungere molte altre personalizzazioni in modo cheil testo corrisponda alle aspettative. Per un elenco completo dei tag SSML utilizzabili consultare Tag SSMLsupportati (p. 116).

Nell'esempio seguente, si utilizza un tag SSML per indicare a Amazon Polly di sostituire "World Wide WebConsortium" con "W3C" in un paragrafo breve. È anche possibile utilizzare i tag per introdurre una pausae sussurrare una parola. Confrontare i risultati di questo esercizio con quelli di Applicazione dei lessicimediante la console (sintesi vocale) (p. 140).

Per ulteriori informazioni su SSML e sui relativi esempi, consultare Tag SSML supportati (p. 116).

Per eseguire la sintesi vocale da testo ottimizzato per SSML (console)


2. Se non è già visualizzata, selezionare la scheda Text-to-Speech (Sintesi vocale).

111



Amazon Polly Developer GuideUtilizzo di SSML in AWS CLI

3. Seleziona la scheda SSML.4. Digita o incolla questo testo nella casella di testo:

<speak> He was caught up in the game.<break time="1s"/> In the middle of the 10/3/2014 <sub alias="World Wide Web Consortium">W3C</sub> meeting, he shouted, "Nice job!" quite loudly. When his boss stared at him, he repeated <amazon:effect name="whispered">"Nice job,"</amazon:effect> in a whisper.</speak>

I tag SSML istruiscono Amazon Polly su come eseguire il rendering del testo:

• <break time="1s"/> indica a Amazon Polly di inserire una pausa di un secondo tra le prime duefrasi.

• <sub alias="World Wide Web Consortium">W3C</sub> indica a Amazon Polly di sostituireWorld Wide Web Consortium con W3C.

• <amazon:effect name="whispered">Nice job</amazon:effect> indica a Amazon Pollydi sussurrare la seconda istanza di "Nice job".

Note

Quando utilizzi AWS CLI, racchiudi il testo di input tra virgolette per differenziarlo dal restodel codice. La console di Amazon Polly non mostra codice, quindi non si racchiude il testodi input tra virgolette quando viene utilizzata.

5. In Choose a language and region (Seleziona una lingua e regione), selezionare English US (Inglese -Stati Uniti) e selezionare una voce.

6. Per ascoltare la sintesi vocale, selezionare Listen to speech (Ascolta sintesi vocale).7. Per salvare il file locale, scegliere Download [format] (Scarica [formato]). Se si desidera salvarlo in un

formato differente, selezionare Change file format (Cambia formato di file) e selezionare il formato chesi desidera. Selezionare Change (Cambia) e Download [format] (Scarica [formato]).

Utilizzo di SSML (AWS CLI)È possibile utilizzare AWS CLI per eseguire la sintesi dell'input di testo SSML. I seguenti esempi mostranocome eseguire attività comuni utilizzando AWS CLI.

Argomenti• Utilizzo di SSML con il comando di sintesi vocale (p. 112)• Sintesi di un documento ottimizzato per SSML (p. 113)• Utilizzo di SSML per le attività comuni di Amazon Polly (p. 114)

Utilizzo di SSML con il comando di sintesi vocaleQuesto esempio illustra come utilizzare il comando synthesize-speech con una stringa SSML. Quandosi utilizza il comando synthesize-speech, in genere si fornisce quanto segue:

• Testo di input (obbligatorio)• Tag di apertura e chiusura (obbligatori)• Formato di output• Voce

112

Amazon Polly Developer GuideSintesi di un documento ottimizzato per SSML

In questo esempio, specificare una semplice stringa di testo tra virgolette con i necessari tag di apertura echiusura <speak></speak>.

Important

Anche se non utilizzi virgolette nel testo di input nella console di Amazon Polly, utilizzale con AWSCLI. È anche importante distinguere le virgolette nel testo di input e le virgolette necessarie per tagsingoli.Ad esempio, è possibile utilizzare le virgolette standard ('') per racchiudere l'input di testo e levirgolette singole (') per i tag interni o viceversa. Entrambe le opzioni funzionano per Unix, Linuxe macOS. Tuttavia, con Windows racchiudere il testo di input tra virgolette standard e utilizzarevirgolette singole per i tag.Per tutti i sistemi operativi, è possibile utilizzare le virgolette standard ('') per racchiudere l'input ditesto e le virgolette singole (') per i tag interni o viceversa. Ad esempio:

--text "<speak>Hello <break time='300ms'/> World</speak>"

Per Unix, Linux e macOS, è possibile anche fare l'inverso, ovvero utilizzare le virgolette singole (')per racchiudere l'input di testo e le virgolette standard (") per i tag interni:

--text '<speak>Hello <break time="300ms"/> World</speak>'


aws polly synthesize-speech \--text-type ssml \--text '<speak>Hello world</speak>' \--output-format mp3 \--voice-id Joanna \speech.mp3

Per ascoltare la sintesi vocale, riprodurre il file risultante speech.mp3 utilizzando qualsiasi lettore audio.

Sintesi di un documento ottimizzato per SSMLPer più testo di input, è consigliabile salvare i tuoi contenuti SSML in un file e semplicemente specificare ilnome di file nel comando synthesize-speech. Ad esempio è possibile salvare quanto segue in un filedenominato example.xml:

<?xml version="1.0"?><speak version="1.1" xmlns="http://www.w3.org/2001/10/synthesis" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.w3.org/2001/10/synthesis http://www.w3.org/TR/speech-synthesis11/synthesis.xsd" xml:lang="en-US">Hello World</speak>

L'attributo xml:lang specifica en-US (Inglese - Stati Uniti) come lingua del testo di input. Per informazionisu come la lingua del testo di input e la lingua della voce selezionata influiscono sul funzionamento diSynthesizeSpeech, consultare Migliorare la pronuncia delle parole straniere (p. 116).

Per eseguire un file ottimizzato per SSML

1. Salvare SSML in un file, (ad esempio example.xml).

113

Amazon Polly Developer GuideUtilizzo di SSML per le attività comuni di Amazon Polly

2. Eseguire il comando synthesize-speech dal percorso dove il file XML è memorizzato e specificareil file SSML come input sostituendo il testo di input con file:\\example.xml. Poiché questocomando punta a un file anziché contenere il testo di input effettivo, non utilizzare le virgolette.

Note

L'esempio seguente di AWS CLI è formattato per Unix, Linux e macOS. Per Windows,sostituisci il carattere di continuazione UNIX barra rovesciata (\) al termine di ogni riga con unaccento circonflesso (^).

aws polly synthesize-speech \--text-type ssml \--text file://example.xml \--output-format mp3 \--voice-id Joanna \speech.mp3

3. Per ascoltare la sintesi vocale, riprodurre il file risultante speech.mp3 utilizzando qualsiasi lettoreaudio.

Utilizzo di SSML per le attività comuni di Amazon PollyI seguenti esempi mostrano come utilizzare i tag SSML per completare attività comuni di Amazon Polly. Perulteriori tag SSML, consultare Tag SSML supportati (p. 116).

Per testare i seguenti esempi, utilizzare il comando seguente synthesize-speech con il testo ottimizzatoper SSML appropriato:


aws polly synthesize-speech \--text-type ssml \--text '<speak>Hello <break time="300ms"/> World</speak>' \--output-format mp3 \--voice-id Joanna \speech.mp3

Aggiunta di una pausaPer aggiungere una pausa tra parole, utilizza l'elemento <break>. Il seguente comando SSMLsynthesize-speech utilizza l'elemento <break> per aggiungere un ritardo di 300 millisecondi tra leparole "Hello" e "World".

<speak> Hello <break time="300ms"/> World.</speak>

Controllo di volume, intonazione e velocitàPer controllare intonazione, velocità e volume del discorso, utilizza l'elemento <prosody>.

• Il seguente comando di sintesi vocale utilizza l'elemento <prosody> per controllare il volume:

<speak>

114

Amazon Polly Developer GuideUtilizzo di SSML per le attività comuni di Amazon Polly

<prosody volume="+20dB">Hello world</prosody></speak>

• Il seguente comando synthesize-speech utilizza l'elemento <prosody> per controllare l'intonazione:

<speak> <prosody pitch="x-high">Hello world.</prosody></speak>

• Il seguente comando synthesize-speech utilizza l'elemento <prosody> per specificare la velocitàdella sintesi vocale:

<speak> <prosody rate="x-fast">Hello world.</prosody></speak>

• È possibile specificare più attributi in un elemento <prosody>, come illustrato negli esempi seguenti:

<speak> <prosody volume="x-loud" pitch="x-high" rate="x-fast">Hello world.</prosody></speak>

SussurrarePer sussurrare parole, utilizzare l'elemento <amazon:effect name="whispered">. Nel seguenteesempio, l'elemento <amazon:effect name="whispered"> indica a Amazon Polly di sussurrare "littlelamb":

<speak> Mary has a <amazon:effect name="whispered">little lamb.</amazon:effect></speak>

Per migliorare questo effetto, utilizza l'elemento <prosody> per rallentare leggermente la sintesi vocalesussurrata.

Enfatizzazione delle parolePer accentuare una parola o frase, utilizza l'elemento <emphasis>.

<speak> <emphasis level="strong">Hello</emphasis> world how are you?</speak>

Specificazione di come pronunciare certe parolePer fornire informazioni sul tipo di testo da pronunciare, utilizza l'elemento <say-as>.

Ad esempio, nella seguente SSML, <say-as> indica che il testo 4/6 deve essere interpretato come unadata. L'attributo interpret-as="date" format="dm" indica che il testo deve essere pronunciato comeuna data con il formato mese/giorno.

È anche possibile utilizzare l'elemento <say-as> per indicare a Amazon Polly di pronunciare i numeri comefrazioni, numeri di telefono, unità di misura e molto altro.

<speak> Today is <say-as interpret-as="date" format="md" >4/6</say-as>

115

Amazon Polly Developer GuideTag SSML supportati

</speak>

La sintesi vocale risultante è "Oggi è il 4 giugno". Il tag <say-as> descrive il modo in cui interpretare iltesto, fornendo ulteriore contesto tramite l'attributo interpret-as.

Per verificare l'accuratezza della sintesi vocale, riprodurre il file risultante speech.mp3.

Per ulteriori informazioni su questo elemento, consulta Controllo sulla pronuncia di tipi speciali di parole (p. 126).

Migliorare la pronuncia delle parole straniereAmazon Polly presume che il testo di input sia nella stessa lingua parlata dalla voce selezionata. Permigliorare la pronuncia delle parole straniere nel testo di input, nella chiamata synthesize-speechspecifica la lingua di destinazione con l'attributo xml:lang. Ciò indica a Amazon Polly di applicare regoledi pronuncia diverse per le parole straniere che contrassegni.

I seguenti esempi mostrano come utilizzare diverse combinazioni di linguaggi nel testo di input e su comespecificare voci e la pronuncia delle parole straniere. Per un elenco completo delle lingue disponibili,consultare Lingue supportate da Amazon Polly (p. 18).

In questo esempio, la voce (Joanna) è una voce inglese degli Stati Uniti. Come impostazione predefinita,Amazon Polly presume che il testo di input sia nella stessa lingua della voce (in questo caso, inglese degliStati Uniti). Quando utilizzi il tag xml:lang, Amazon Polly interpreta il testo come spagnolo e il testo èpronunciato come la voce selezionata pronuncerebbe le parole spagnole, in base alle regole di pronunciadella lingua straniera. Senza questo tag, il testo viene pronunciato utilizzando le regole di pronuncia dellavoce selezionata.

<speak> That restaurant is terrific. <lang xml:lang="es-ES">Mucho gusto.</lang></speak>

Poiché la lingua del testo di input è l'inglese, Amazon Polly associa i fonemi spagnoli ai fonemi inglesi piùsimili. Di conseguenza, Joanna pronuncia il testo come madre lingua degli Stati Uniti che pronuncia leparole correttamente in spagnolo, ma con un accento inglese degli Stati Uniti.

Note

Alcune lingue sono più simili di altre e quindi alcune combinazioni funzionano meglio di altre.

Tag SSML supportatiAmazon Polly supporta i seguenti tag SSML:

Azione Tag SSML Disponibilità convoci neurali

Aggiunta di una pausa (p. 118) <break> Disponibilitàcompleta

Enfatizzazione delle parole (p. 118) <emphasis> Non disponibile

Impostazione di un'altra lingua perparole specifiche (p. 119)

<lang> Disponibilitàcompleta

Posizionamento di un tag personalizzatonel testo (p. 120)

<mark> Disponibilitàcompleta

116

Amazon Polly Developer GuideIdentificazione di testo ottimizzato per SSML

Azione Tag SSML Disponibilità convoci neurali

Aggiunta di una pausa tra paragrafi (p. 120)

<p> Disponibilitàcompleta

Utilizzo della pronuncia fonetica (p. 121)

<phoneme> Disponibilitàcompleta

Controllo di volume, velocità dipronuncia e intonazione (p. 121)

<prosody> Disponibilitàparziale

Impostazione di una durata massima perla sintesi vocale (p. 123)

<prosody amazon:max-duration> Non disponibile

Aggiunta di una pausa tra frasi (p. 126)

<s> Disponibilitàcompleta

Controllo sulla pronuncia di tipi specialidi parole (p. 126)

<say-as> Disponibilitàparziale

Identificazione di testo ottimizzato perSSML (p. 117)

<speak> Disponibilitàcompleta

Pronuncia di acronimi e abbreviazioni (p. 128)

<sub> Disponibilitàcompleta

Miglioramento della pronunciaspecificando le parti del discorso (p. 129)

<w> Disponibilitàcompleta

Aggiunta del suono respiratorio (p. 130)

<amazon:auto-breaths> Non disponibile

Stile di pronuncia Conversational (p. 132)

<amazon:domainname="conversational">

Seleziona solo vocineurali

Stile di pronuncia newscaster (p. 133) <amazon:domain name="news"> Seleziona solo vocineurali

Aggiunta della compressione dinamicaagli intervalli (p. 133)

<amazon:effect name="drc"> Disponibilitàcompleta

Pronuncia con un tono più morbido (p. 135)

<amazon:effect phonation="soft"> Non disponibile

Controllo del timbro (p. 135) <amazon:effect vocal-tract-length> Non disponibile

Sussurrare (p. 136) <amazon: effect name="whispered"> Non disponibile

Se utilizzi tag SSML non supportati in formato neurale o standard, viene restituito un errore.

Identificazione di testo ottimizzato per SSMLIl tag <speak> è l'elemento principale di tutto il testo SSML di Amazon Polly. Tutto il testo ottimizzato perSSML deve essere racchiuso in una coppia di tag <speak>.

<speak>Mary had a little lamb.</speak>

117

Amazon Polly Developer GuideAggiunta di una pausa

Questo tag è supportato dai formati TTS neurali e standard.

Aggiunta di una pausa<break>

Per aggiungere una pausa al testo, utilizza il tag <break>. È possibile impostare una pausa in baseall'intensità (equivalente alla pausa dopo una virgola, una frase o un paragrafo), oppure in base a undeterminato intervallo di tempo in secondi o millisecondi. Se non si specifica un attributo per stabilire ladurata della pausa, Amazon Polly utilizza l'impostazione predefinita <break strength="medium">, cheaggiunge una pausa della lunghezza di una pausa dopo la virgola.

strengthvalori attributo:

• none: nessuna pausa. Utilizza none per rimuovere una pausa che si verifica normalmente, ad esempiodopo un punto.

• x-weak: ha la stessa forza di none, senza pausa.• weak: imposta una pausa della stessa durata della pausa dopo la virgola.• medium: ha la stessa forza di weak.• strong: imposta una pausa della stessa durata della pausa dopo una frase.• x-strong: imposta una pausa della stessa durata della pausa dopo un paragrafo.

time valori attributo:

• [number]s: la durata della pausa, in secondi. La durata massima è 10s.• [number]ms: la durata della pausa, in millisecondi. La durata massima è 10000ms.

Ad esempio:

<speak> Mary had a little lamb <break time="3s"/>Whose fleece was white as snow.</speak>

Se con il tag break non viene utilizzato nessun attributo, il risultato varia a seconda del testo:

• Se non c'è altra punteggiatura accanto al tag break, verrà creata una <break strength="medium">(comma-length pause).

• Se il tag è accanto a una virgola, il tag verrà aggiornato a una <break strength="strong">(sentence-length pause).

• Se il tag è accanto a un punto, il tag verrà aggiornato a una <break strength="x-strong">(paragraph-length pause).


Enfatizzazione delle parole<emphasis>

Per enfatizzare le parole, utilizza il tag <emphasis>. L'enfatizzazione delle parole modifica la velocità e ilvolume della sintesi vocale. Una maggiore enfasi significa che Amazon Polly pronuncia il testo a voce piùalta e più lentamente. Con una minore enfasi, viene pronunciato più velocemente e con tono più pacato.Per specificare il grado di enfasi, utilizzare l'attributo level.

118

Amazon Polly Developer GuideImpostazione di un'altra lingua per parole specifiche

level valori attributo:

• Strong: aumenta il volume e rallenta la velocità di pronuncia in modo che la sintesi vocale sia più lenta econ un tono più alto.

• Moderate: aumenta il volume e rallenta la velocità di pronuncia, ma meno rispetto a strong.Moderate è il valore predefinito.

• Reduced: diminuisce il volume e accelera la velocità di pronuncia. La sintesi vocale viene pronunciatapiù velocemente e con tono più morbido.

Note

Il volume e la velocità di pronuncia normali per una voce rientrano tra i livelli moderate ereduced.

Ad esempio:

<speak> I already told you I <emphasis level="strong">really like</emphasis> that person.</speak>

Questo tag è attualmente supportato solo dal formato TTS standard.

Impostazione di un'altra lingua per parole specifiche<lang>

Specifica un'altra lingua per una determinata parola o frase con il tag <lang>. Le parole e frasi di linguestraniere generalmente sono pronunciate in modo più chiaro quando vengono incluse all'interno di unacoppia di tag <lang>. Per specificare la lingua, utilizzare l'attributo xml:lang. Per un elenco completodelle lingue disponibili, consultare Lingue supportate da Amazon Polly (p. 18).

Se non si applica il tag <lang>, tutte le parole del testo di input vengono pronunciate nella lingua dellavoce specificata in voice-id. Se si applica il tag <lang>, le parole sono pronunciate in tale lingua.

Ad esempio, se il voice-id è Joanna che parla inglese (Stati Uniti), Amazon Polly pronuncia quantosegue con la voce di Joanna senza un accento francese:

<speak> Je ne parle pas français.</speak>

Se utilizzi la voce Joanna con il tag <lang>, Amazon Polly pronuncia la frase con la voce di Joanna in unfrancese con un accento americano:

<speak> <lang xml:lang="fr-FR">Je ne parle pas français.</lang>.</speak>

Poiché Joanna non è madrelingua francese, la pronuncia si basa sulla sua lingua nativa, ovvero l'inglesedegli Stati Uniti. Ad esempio, sebbene una perfetta pronuncia francese presenti una /R/vibrata alveolarenella parola français, la voce di Joanna in inglese americano pronuncia questo fonema con il suonocorrispondente /r/.

Se utilizzi il voice-id di Giorgio, che parla italiano, con il seguente testo, Amazon Polly pronuncia la frasecon la voce di Giorgio e la pronuncia in italiano:

119

Amazon Polly Developer GuidePosizionamento di un tag personalizzato nel testo

<speak> Mi piace Bruce Springsteen.</speak>

Se utilizzi la stessa voce con il seguente tag <lang>, Amazon Polly pronuncia Bruce Springsteen ininglese con l'accento italiano:

<speak> Mi piace <lang xml:lang="en-US">Bruce Springsteen.</lang></speak>

Questo tag può essere utilizzato anche per sostituire l'opzione DefaultLangCode facoltativa nella sintesivocale. Tuttavia, questa operazione richiede la formattazione del testo con SSML.


Posizionamento di un tag personalizzato nel testo<mark>

Per inserire un tag personalizzato all'interno del testo, utilizza il tag <mark>. Amazon Polly non intraprendealcuna azione sul tag, ma restituisce la posizione del tag nei metadati SSML. Questo tag può esserequalsiasi operazione per la quale si desidera effettuare la chiamata, purché mantenga il formato seguente:

<mark name="tag_name"/>

Ad esempio, se il nome del tag è "animal" e il testo di input è:

<speak> Mary had a little <mark name="animal"/>lamb.</speak>

È possibile che Amazon Polly restituisca i seguenti metadati da SSML:

{"time":767,"type":"ssml","start":25,"end":46,"value":"animal"}


Aggiunta di una pausa tra paragrafi<p>

Per aggiungere una pausa tra paragrafi nel tuo testo, utilizza il tag <p>. L'utilizzo di questo tag fornisce unapausa più lunga rispetto alle pause dei madrelingua dopo le virgole o la fine di una frase. Utilizza il tag <p>per racchiudere il paragrafo:

<speak> <p>This is the first paragraph. There should be a pause after this text is spoken.</p> <p>This is the second paragraph.</p> </speak>

Ciò equivale a specificare una pausa utilizzando <break strength="x-strong"/>.


120

API_StartSpeechSynthesisTask.html#polly-StartSpeechSynthesisTask-request-DefaultLangCode

Amazon Polly Developer GuideUtilizzo della pronuncia fonetica

Utilizzo della pronuncia fonetica<phoneme>

Per fare in modo che Amazon Polly utilizzi la pronuncia fonetica per il testo specifico, utilizza il tag<phoneme>.

Con il tag <phoneme> sono necessari due attributi. Indicano l'alfabeto fonetico utilizzato da Amazon Polly ei simboli fonetici della pronuncia corretta:

• alphabet

• ipa: indica che verrà utilizzato l'alfabeto fonetico internazionale (IPA).• x-sampa: indica che verrà utilizzato l'alfabeto X-SAMPA (Extended Speech Assessment Methods

Fonetico Alphabet).• ph

• Specifica i simboli fonetici per la pronuncia. Per ulteriori informazioni, consulta Tabelle fonemi e visemiper le lingue supportate (p. 19)

Con il tag <phoneme>, Amazon Polly utilizza la pronuncia specificata dall'attributo ph invece dellapronuncia standard associata come impostazione predefinita al linguaggio utilizzato dalla voce selezionata.

Ad esempio, la parola "pecan" può essere pronunciata in due modi. In questo esempio, alla parola "pecan"viene assegnata una pronuncia diversa in ciascuna riga. Amazon Polly pronuncia "pecan" come specificatonegli attributi ph, anziché utilizzare la pronuncia predefinita.

Alfabeto fonetico internazionale (IPA)

<speak> You say, <phoneme alphabet="ipa" ph="p##k##n">pecan</phoneme>. I say, <phoneme alphabet="ipa" ph="#pi.kæn">pecan</phoneme>.</speak>

Extended Speech Assessment Methods Phonetic Alphabet (X-SAMPA)

<speak> You say, <phoneme alphabet='x-sampa' ph='pI"kA:n'>pecan</phoneme>. I say, <phoneme alphabet='x-sampa' ph='"pi.k{n'>pecan</phoneme>. </speak>

Inoltre, il cinese mandarino utilizza Pinyin per la pronuncia fonetica.

Pinyin

<speak> ## <phoneme alphabet="x-amazon-pinyin" ph="bo2">#</phoneme># ## <phoneme alphabet="x-amazon-pinyin" ph="bao2">#</phoneme>#</speak>


Controllo di volume, velocità di pronuncia eintonazione<prosody>

Per controllare il volume, la velocità o l'intonazione della voce selezionata, utilizza il tag prosody.

121

Amazon Polly Developer GuideControllo di volume, velocità di pronuncia e intonazione

Il volume, la velocità della sintesi vocale e l'intonazione dipendono dalla voce specifica selezionata. Oltrealle differenze tra voci per diversi linguaggi, ci sono differenze tra le singole voci che parlano la stessalingua. Per questo motivo, mentre gli attributi sono simili in tutti i linguaggi, ci sono chiare varianti da linguaa lingua e nessun valore assoluto è disponibile.

Il tag prosody ha tre attributi, ognuno dei quali dispone di diversi valori disponibili per impostare l'attributo.Ogni attributo utilizza la stessa sintassi:

<prosody attribute="value"></prosody>

• volume

• default: reimposta il volume sul livello di default per la voce corrente.• silent, x-soft, soft, medium, loud, x-loud: consente di specificare il volume su un valore di

default per la voce corrente.• +ndB, -ndB: modifica il volume in relazione al livello corrente. Il valore +0dB indica che il volume

rimane invariato, mentre +6dB indica circa il doppio dell'attuale volume e -6dB indica circa la metàdell'attuale volume.

Ad esempio, è possibile impostare il volume per un passaggio come segue:

<speak> Sometimes it can be useful to <prosody volume="loud">increase the volume for a specific speech.</prosody> </speak>

In alternativa, puoi impostarlo in questo modo:

<speak> And sometimes a lower volume <prosody volume="-6dB">is a more effective way of interacting with your audience.</prosody> </speak>

• rate

• x-slow, slow, medium, fast,x-fast. impostare l'intonazione su un valore predefinito per la voceselezionata.

• n%: Una modifica della percentuale non negativa nella velocità di pronuncia. Ad esempio, un valoredi 100% significa nessun cambiamento alla velocità di pronuncia, un valore pari a 200% significa unavelocità di pronuncia il doppio della velocità predefinita e un valore del 50% significa una velocità dipronuncia la metà della velocità predefinita. Questo valore ha un intervallo di 20-200%.

Ad esempio, è possibile impostare la velocità della sintesi vocale per un passaggio come segue:

<speak> For dramatic purposes, you might wish to <prosody rate="slow">slow up the speaking rate of your text.</prosody> </speak>


<speak> Although in some cases, it might help your audience to <prosody rate="85%">slow the speaking rate slightly to aid in comprehension.</prosody> </speak>

• pitch

• default: reimposta l'intonazione sul livello di default per la voce corrente.

122

Amazon Polly Developer GuideImpostazione di una durata massima per la sintesi vocale

• x-low, low, medium, high, x-high: imposta l'intonazione su un valore predefinito per la vocecorrente.

• +n% o -n%: regola l'intonazione in base a una percentuale relativa. Ad esempio, un valore di +0%significa che non c'è alcun cambiamento nell'intonazione di base, +5% offre un'intonazione di baseleggermente più elevata, mentre -5% avrà come risultato un'intonazione di base leggermente inferiore.

Ad esempio, è possibile impostare l'intonazione per un passaggio come segue:

<speak> Do you like sythesized speech <prosody pitch="high">with a pitch that is higher than normal?</prosody> </speak>


<speak> Or do you prefer your speech <prosody pitch="-10%">with a somewhat lower pitch?</prosody> </speak>

Il tag <prosody > deve contenere almeno un attributo, ma può includerne di più all'interno dello stesso tag.

<speak> Each morning when I wake up, <prosody volume="loud" rate="x-slow">I speak quite slowly and deliberately until I have my coffee.</prosody></speak>

Può anche essere combinato con tag nidificati, come segue:

<speak> <prosody rate="85%">Sometimes combining attributes <prosody pitch="-10%">can change the impression your audience has of a voice</prosody> as well.</prosody> </speak>

Questo tag è completamente supportato dal formato TTS standard. I tag <prosody volume> e<prosody rate> sono completamente supportati da NTTS, mentre il tag <prosody pitch> non èsupportato.

Impostazione di una durata massima per la sintesivocale<prosody amazon:max-duration>

Per controllare la durata di un discorso quando viene sintetizzato, utilizza il tag <prosody> con l'attributoamazon:max-duration.

La durata della sintesi vocale varia leggermente a seconda della voce selezionata. Potrebbe quindi esseredifficile associare la sintesi vocale a grafica o altre attività che richiedono tempi precisi. Questo problemapeggiora con le applicazioni di traduzione, perché il tempo necessario per pronunciare frasi specifiche puòvariare ampiamente con lingue diverse.

Il tag <prosody amazon:max-duration> associa la sintesi vocale alla quantità di tempo che desiderarichiedere (la durata).

123


Questo tag utilizza la sintassi seguente:

<prosody amazon:max-duration="time duration">

Con il tag <prosody amazon:max-duration>, puoi specificare la durata in secondi o millisecondi:

• ns: durata massima in secondi• nms: durata massima in millisecondi

Ad esempio, il seguente testo parlato ha una durata massima di 2 secondi:

<speak> <prosody amazon:max-duration="2s"> Human speech is a powerful way to communicate. </prosody></speak>

Il testo posizionato all'interno del tag non supera la durata specificata. Se la voce o la lingua sceltarichiederebbe normalmente più tempo di tale durata, Amazon Polly accelera la sintesi vocale in modo cherientri nella durata specificata.

Se la durata specificata è superiore a quella richiesta per leggere il testo a una velocità normale, AmazonPolly legge la sintesi vocale normalmente. Non rallenta la sintesi vocale, né aggiunge silenzio, perciòl'audio risultante è più breve di quanto richiesto.

Note

Amazon Polly aumenta la velocità non più di 5 volte rispetto alla velocità normale. Se il testo vieneletto più velocemente, non è in genere comprensibile. Se una sintesi vocale non rientra nelladurata specificata anche quando accelerata al massimo, l'audio sarà accelerato ma durerà piùdella durata specificata.

Puoi includere una sola frase o più frasi all'interno di un tag <prosody amazon:max-duration> e puoiutilizzare più tag <prosody amazon:max-duration> all'interno del testo.

Ad esempio:

<speak> <prosody amazon:max-duration="2400ms"> Human speech is a powerful way to communicate. </prosody> <break strength="strong"/> <prosody amazon:max-duration="5100ms"> Even a simple ‘Hello’ can convey a lot of information depending on the pitch, intonation, and tempo. </prosody> <break strength="strong"/> <prosody amazon:max-duration="8900ms"> We naturally understand this information, which is why speech is ideal for creating applications where a screen isn’t practical or possible, or simply isn’t convenient. </prosody></speak>

L'utilizzo del tag <prosody amazon:max-duration> può aumentare la latenza quando Amazon Pollyrestituisce una sintesi vocale. Il grado di latenza dipende dal passaggio e dalla relativa lunghezza. Èconsigliabile utilizzare testo costituito da passaggi di testo relativamente brevi.

124


Limitazioni

Non vi sono limitazioni nella modalità di utilizzo del tag <prosody amazon:max-duration> né su comefunziona con altri tag SSML:

• Il testo all'interno di un tag <prosody amazon:max-duration> non può superare il limite di 1.500caratteri.

• Non è possibile nidificare i tag <prosody amazon:max-duration>. Se hai inserito un tag <prosodyamazon:max-duration> all'interno di un altro, Amazon Polly ignora il tag interno.

Ad esempio, nell'istruzione seguente, il tag <prosody amazon:max-duration="5s"> viene ignorato:

<speak> <prosody amazon:max-duration="16s"> Human speech is a powerful way to communicate. <prosody amazon:max-duration="5s"> Even a simple ‘Hello’ can convey a lot of information depending on the pitch, intonation, and tempo. </prosody>

We naturally understand this information, which is why speech is ideal for creating applications where a screen isn’t practical or possible, or simply isn’t convenient. </prosody></speak>

• Non è possibile utilizzare i tag <prosody> con l'attributo rate all'interno di un tag <prosodyamazon:max-duration>. Questo perché entrambi hanno impatto sulla velocità a cui il testo vienepronunciato.

Nell'esempio seguente, Amazon Polly ignora il tag <prosody rate="2">:

<speak> <prosody amazon:max-duration="7500ms"> Human speech is a powerful way to communicate. <prosody rate="2"> Even a simple ‘Hello’ can convey a lot of information depending on the pitch, intonation, and tempo. </prosody> </prosody></speak>

Pause e max-duration

Quando utilizzi il tag max-duration, puoi comunque inserire pause all'interno del testo. Tuttavia, AmazonPolly include la lunghezza della pausa quando si calcola la durata massima per sintesi vocale. Inoltre,Amazon Polly conserva le brevi pause che si verificano laddove virgole e punti vengono posizionatiall'interno di un passaggio e le include nella durata massima.

Ad esempio, nel blocco seguente, l'interruzione di 600 millisecondi e le interruzioni causate dalle virgole e ipunti si verificano all'interno della sintesi vocale da 8 secondi:

<speak> <prosody amazon:max-duration="8s"> Human speech is a powerful way to communicate. <break time="600ms"/> Even a simple ‘Hello’ can convey a lot of information depending on the pitch, intonation, and tempo.

125

Amazon Polly Developer GuideAggiunta di una pausa tra frasi

</prosody></speak>


Aggiunta di una pausa tra frasi<s>

Per aggiungere una pausa tra righe o frasi nel tuo testo, utilizzare il tag <s>. L'utilizzo del tag ha lo stessoeffetto di:

• Terminare una frase con un punto (.)• Specificare una pausa con <break strength="strong"/>

A differenza del tag <break>, il tag <s > racchiude la frase. Questa funzione è utile per la sintesi vocaleche è organizzata in righe, invece di frasi, ad esempio le poesie.

Nell'esempio seguente, il tag <s> crea una breve pausa dopo la prima e la seconda frase. La frase finalenon presenta tag <s>, ma è anche seguita da una breve pausa perché finisce con un punto.

<speak> <s>Mary had a little lamb</s> <s>Whose fleece was white as snow</s> And everywhere that Mary went, the lamb was sure to go.</speak>


Controllo sulla pronuncia di tipi speciali di parole<say-as>

Utilizza il tag <say-as> con l'attributo interpret-as per indicare a Amazon Polly come pronunciaredeterminati caratteri, parole e numeri. In tal modo è possibile fornire ulteriore contesto per eliminarequalsiasi ambiguità in merito a come deve essere effettuato il rendering del testo da parte di Amazon Polly.

Il tag say-as utilizza un attributo <interpret-as>, che utilizza una serie di possibili valori disponibili. Ogniattributo utilizza la stessa sintassi:

<say-as interpret-as="value">[text to be interpreted]</say-as>

I valori seguenti sono disponibili con interpret-as:

• characters o spell-out: scandisce ogni lettera del testo, come in a-b-c.

Note

Questa opzione non è attualmente supportata con le voci neurali. Se questo codice SSML vienerilevato da Amazon Polly in fase di runtime, la frase interessata verrà sintetizzata utilizzando lavoce standard correlata. Tieni presente, tuttavia, che questa frase sarà comunque conteggiatacome se utilizzasse la voce neurale.

• cardinal o number: interpreta il testo numerico come un numero cardinale, come in 1.234.• ordinal: interpreta il testo numerico come numero ordinale, come 1.234°.• digits: pronuncia ogni cifra individualmente, come in 1-2-3-4.

126

Amazon Polly Developer GuideControllo sulla pronuncia di tipi speciali di parole

• fraction: interpreta il testo numerico come frazione. Questo è valido sia per frazioni comuni, adesempio 3/20, sia per frazioni miste, ad esempio 2 ½. Guardare qui di seguito per ulteriori informazioni.

• unit: interpreta un testo numerico come una misura. Il valore deve essere un numero o una frazioneseguita da un'unità senza spazi tra i due elementi come in 1/2inch oppure da un'unità come in 1meter.

• date: interpreta il testo come data. Il formato della data deve essere specificato con l'attributo formato.Guardare qui di seguito per ulteriori informazioni.

• time: interpreta il testo numerico come durata espressa in minuti e secondi, come in 1'21".• address: interpreta il testo come parte di un indirizzo.• expletive: sostituisce con un segnale acustico il contenuto incluso nel tag.• telephone: interpreta il testo numerico come un numero di telefono di 7 cifre o 10 cifre, ad esempio2025551212. È anche possibile utilizzare questo valore per gestire le estensioni telefoniche, ad esempio2025551212x345. Guardare qui di seguito per ulteriori informazioni.

Note

Attualmente l'opzione telephone non è disponibile per tutte le lingue. Tuttavia, è disponibileper le varianti di lingua inglese (en-AU, en-GB, en-IN, en-US ed en-GB-WLS), varianti dilingua spagnola (es-ES, es-MX ed es-US), varianti di lingua francese (fr-FR e fr-CA) e variantiportoghesi (pt-BR e pt-PT), così come tedesco (de-DE), italiano (it-IT), giapponese (ja-JP)e russo (ru-RU). Va inoltre notato che in alcuni casi, lingue come l'arabo (arb) gestisconoautomaticamente il numero impostato come numero di telefono e quindi non implementanoeffettivamente il tag telephone SSML.

Frazioni

Amazon Polly interpreta i valori nel tag say-as che presentano l'attributo interpret-as="fraction"come comuni frazioni. Di seguito è riportata la sintassi per le frazioni:

• Frazione

Sintassi: numero cardinale/numero cardinale, ad esempio 2/9.

Ad esempio: <say-as interpret-as="fraction">2/9</say-as> si pronuncia "due noni."• Numero misto non negativo

Sintassi: numero cardinale+numero cardinale/numero cardinale, ad esempio 3+1/2.

Ad esempio: <say-as interpret-as="fraction">3+1/2</say-as> si pronuncia "tre e mezzo".

Note

Deve esserci un segno + tra "3" e "1/2". Amazon Polly non supporta un numero misto senza ilsegno +, ad esempio "3 1/2".

Date:

Quando interpret-as è impostato su date, è necessario indicare il formato della data.

Questo utilizza la sintassi seguente:

<say-as interpret-as="date" format="format">[date]</say-as>

Ad esempio:

<speak> I was born on <say-as interpret-as="date" format="mdy">12-31-1900</say-as>.

127

Amazon Polly Developer GuidePronuncia di acronimi e abbreviazioni

</speak>

I formati seguenti possono essere utilizzati con l'attributo date.

• mdy: mese-giorno-anno.• dmy: giorno-mese-anno.• ymd: anno-mese-giorno.• md: mese-giorno.• dm: giorno-mese.• ym: anno-mese.• my: mese-anno.• d: giorno.• m: mese.• y: anno.• yyyymmdd: anno-mese-giorno. Se utilizzi questo formato, puoi fare in modo che Amazon Polly salti parti

della data utilizzando punti di domanda.

Ad esempio, Amazon Polly riproduce quanto segue come "22 settembre":

<say-as interpret-as="date">????0922</say-as>

Format non è necessario.

Telefono

Amazon Polly tenta di interpretare il testo fornito correttamente in base alla formattazione del testo anchesenza il tag <say-as>. Ad esempio, se il testo include "202-555-1212", Amazon Polly lo interpreta comeun numero di telefono a 10 cifre e pronuncia ogni singola cifra individualmente, con una breve pausaper ogni trattino. In questo caso, non utilizzare <say-as interpret-as="telephone">. Tuttavia,se desideri che il testo "2025551212" venga pronunciato da Amazon Polly come un numero di telefono,utilizza <say-as interpret-as="telephone">.

La logica per l'interpretazione di ciascun elemento è specifica per la lingua. Ad esempio, i numeri ditelefono sono pronunciati in modo diverso nell'inglese americano e nell'inglese britannico (nell'inglesebritannico, vengono raggruppate sequenze della stessa cifra, ad esempio "doppio cinque" o "triploquattro"). Per mostrare la differenza, è possibile testare il seguente esempio scegliendo la voce in ingleseamericano e in inglese britannico:

<speak> Richard's number is <say-as interpret-as="telephone">2122241555</say-as></speak>

Ad eccezione della funzionalità "characters" o "spell-out", questo tag è supportato dai formati TTS neuralie standard. Se questo codice SSML viene rilevato da Amazon Polly in fase di runtime, la frase interessataverrà sintetizzata utilizzando la voce standard correlata. Tieni presente, tuttavia, che questa frase saràcomunque conteggiata come se utilizzasse la voce neurale.

Pronuncia di acronimi e abbreviazioni<sub>

Utilizza il tag <sub> con l'attributo alias per sostituire una parola diversa (o pronuncia) per il testoselezionato, ad esempio un acronimo o un'abbreviazione.

128

Amazon Polly Developer GuideMiglioramento della pronuncia

specificando le parti del discorso

Questo utilizza la sintassi:

<sub alias="new word">abbreviation</sub>

In questo esempio, il simbolo chimico dell'elemento viene sostituito con il nome "Mercury" per rendere piùchiari i contenuti audio.

<speak> My favorite chemical element is <sub alias="Mercury">Hg</sub>, because it looks so shiny. </speak>


Miglioramento della pronuncia specificando le parti deldiscorso<w>

Puoi utilizzare il tag <w> per personalizzare la pronuncia delle parole specificando la parte del discorsodella parola o un altro significato. Questa operazione viene eseguita utilizzando l'attributo role.

Questo tag utilizza la sintassi seguente:

<w role="attribute">text</w>

È possibile utilizzare i seguenti valori per l'attributo role:

Per specificare la parte del discorso:

• amazon:VB: interpreta la parola come un verbo (presente semplice).• amazon:VBD: interpreta la parola come un verbo all'imperfetto oppure al participio passato.

Ad esempio, a seconda della parte del discorso, la pronuncia inglese americana della parola "read" varia inbase al tag:

<speak> The word <say-as interpret-as="characters">read</say-as> may be interpreted as either the present simple form <w role="amazon:VB">read</w>, or the past participle form <w role="amazon:VBD">read</w>.</speak>

Per specificare un altro significato:

• amazon:SENSE_1: utilizza il significato non di default della parola, laddove presente. Ad esempio, ilsostantivo "bass" è pronunciato in modi differenti a seconda del suo significato. Il significato predefinitoè la parte inferiore della scala musicale. L'altro significato è una specie di pesce d'acqua dolce, dettoanche "bass" ma pronunciato in modo diverso. Utilizzando <w role="amazon:SENSE_1">bass</w>si rende la pronuncia non di default (pesce d'acqua dolce) per il testo dell'audio.

Questa differenza può essere percepita sintetizzando quanto segue:

<speak> Depending on your meaning, the word <say-as interpret-as="characters">bass</say-as>

129

Amazon Polly Developer GuideAggiunta del suono respiratorio

may be interpreted as either a musical element: read, or as its alternative meaning, a fresh waterfish <w role="amazon:SENSE_1">bass</w>.</speak>

Note

Alcune lingue possono avere una selezione diversa delle parti del discorso supportate.


Aggiunta del suono respiratorio<amazon:breath> e <amazon:auto-breaths>

Il linguaggio naturale include sia parole correttamente pronunciate sia suoni respiratori. Aggiungendosuoni respiratori alla sintesi vocale, è possibile rendere il suono più naturale. I tag <amazon:breath> e<amazon:auto-breaths> forniscono le respirazioni. Sono disponibili le seguenti opzioni:

• Modalità manuale: puoi impostare la posizione, la durata e il volume di una respirazione all'interno deltesto

• Modalità automatica: Amazon Polly inserisce automaticamente i suoni della respirazione nell'output deldiscorso

• Modalità mista: sia tu sia Amazon Polly aggiungete i suoni della respirazione

Modalità manuale

Nella modalità manuale, inserisci il tag <amazon:breath/> nel testo di input in cui desideri posizionareun respiro. Puoi personalizzare la durata e il volume delle respirazioni con, rispettivamente, gli attributiduration e volume:

• duration: controlla la durata del respiro. I valori validi sono: default, x-short, short, medium,long, x-long. Il valore predefinito è medium.

• volume: controlla il volume del respiro. I valori validi sono: default, x-soft, soft, medium, loud, x-loud. Il valore predefinito è medium.

Note

La lunghezza esatta e il volume di ogni valore dell'attributo dipendono dalla voce di Amazon Pollyspecifica utilizzata.

Per impostare il suono di una respirazione utilizzando le impostazioni predefinite, usa <amazon:breath/>senza attributi.

Ad esempio, per utilizzare gli attributi per impostare la durata e il volume di un respiro su un valore medio,devi configurare gli attributi come segue:

<speak> Sometimes you want to insert only <amazon:breath duration="medium" volume="x-loud"/>a single breath.</speak>

Per usare le impostazioni predefinite, è sufficiente utilizzare il tag:

<speak>

130

Amazon Polly Developer GuideAggiunta del suono respiratorio

Sometimes you need <amazon:breath/>to insert one or more average breathes <amazon:breath/> so that the text sounds correct.</speak>

Puoi aggiungere singoli suoni respiratori all'interno di un passaggio, come segue:

<speak> <amazon:breath duration="long" volume="x-loud"/> <prosody rate="120%"> <prosody volume="loud"> Wow! <amazon:breath duration="long" volume="loud"/> </prosody> That was quite fast <amazon:breath duration="medium" volume="x-loud"/>. I almost beat my personal best time on this track. </prosody></speak>

Modalità automatica

Nella modalità automatica, utilizzi il tag <amazon:auto-breaths> per dire a Amazon Polly di creareautomaticamente suoni respiratori a intervalli stabiliti. Puoi impostare la frequenza degli intervalli, ilvolume e la durata. Posiziona il tag </amazon:auto-breaths> all'inizio del testo a cui vuoi applicare larespirazione automatica e chiudi il tag al termine.

Note

A differenza del tag <amazon:breath/> della modalità manuale, il tag <amazon:auto-breaths> richiede un tag di chiusura (</amazon:auto-breaths>).

È possibile utilizzare i seguenti attributi opzionali con il tag <amazon:auto-breaths>:

• volume: controlla il volume del respiro. I valori validi sono: default, x-soft, soft, medium, loud, x-loud. Il valore predefinito è medium.

• frequency: controlla la frequenza con cui il respiro è presente nel testo. I valori validi sono: default,x-low, low, medium, high, x-high. Il valore predefinito è medium.

• duration: controlla la durata del respiro. I valori validi sono: default, x-short, short, medium,long, x-long. Il valore predefinito è medium.

Per impostazione predefinita, la frequenza dei suoni di respirazione dipende dal testo di input. Tuttavia, isuoni della respirazione spesso si verificano dopo virgole e punti.

Gli esempi seguenti mostrano come utilizzare il tag <amazon:auto-breaths>. Per scegliere le opzionida utilizzare per i tuoi contenuti, copia gli esempi applicabili sulla console di Amazon Polly e ascolta ledifferenze.

• Utilizzo della modalità automatica senza parametri opzionali.

<speak> <amazon:auto-breaths>Amazon Polly is a service that turns text into lifelike speech, allowing you to create applications that talk and build entirely new categories of speech- enabled products. Amazon Polly is a text-to-speech service that uses advanced deep learning technologies to synthesize speech that sounds like a human voice. With dozens of lifelike voices across a variety of languages, you can select the ideal voice and build speech- enabled applications that work in many different countries.</amazon:auto-breaths></speak>

131

Amazon Polly Developer GuideStile di pronuncia Conversational

• Utilizzo della modalità automatica con il controllo del volume. I parametri non specificati (duration efrequency) sono impostati sui valori predefiniti (medium).

<speak> <amazon:auto-breaths volume="x-soft">Amazon Polly is a service that turns text into lifelike speech, allowing you to create applications that talk and build entirely new categories of speech-enabled products. Amazon Polly is a text-to-speech service, that uses advanced deep learning technologies to synthesize speech that sounds like a human voice. With dozens of lifelike voices across a variety of languages, you can select the ideal voice and build speech- enabled applications that work in many different countries.</amazon:auto-breaths></speak>

• Utilizzo della modalità automatica con il controllo della frequenza. I parametri non specificati (duratione volume) sono impostati sui valori predefiniti (medium).

<speak> <amazon:auto-breaths frequency="x-low">Amazon Polly is a service that turns text into lifelike speech, allowing you to create applications that talk and build entirely new categories of speech-enabled products. Amazon Polly is a text-to-speech service, that uses advanced deep learning technologies to synthesize speech that sounds like a human voice. With dozens of lifelike voices across a variety of languages, you can select the ideal voice and build speech- enabled applications that work in many different countries.</amazon:auto-breaths></speak>

• Utilizzo della modalità automatica con più parametri. Per il parametro Duration non specificato,Amazon Polly usa il valore predefinito (medium).

<speak> <amazon:auto-breaths volume="x-loud" frequency="x-low">Amazon Polly is a service that turns text into lifelike speech, allowing you to create applications that talk and build entirely new categories of speech-enabled products. Amazon Polly is a text-to-speech service, that uses advanced deep learning technologies to synthesize speech that sounds like a human voice. With dozens of lifelike voices across a variety of languages, you can select the ideal voice and build speech-enabled applications that work in many different countries.</amazon:auto-breaths></speak>


Stile di pronuncia Conversational<amazon:domain name="conversational">

Lo stile Conversational è disponibile solo per le voci di Matthew o Joanna, disponibili solo in inglese StatiUniti (en-US) nel formato Neural.

132

Amazon Polly Developer GuideStile di pronuncia newscaster

Per utilizzare lo stile di pronuncia Conversational, è possibile utilizzare i tag SSML e la seguente sintassi:

<amazon:domain name="conversational">text</amazon:domain>

Ad esempio, puoi utilizzare lo stile di pronuncia Newscaster con la voce di Matthew o Joanna come segue:

<speak> <amazon:domain name="conversational"> I really didn't know how this morning was going to start. And if I had known, I think I might have just stayed in bed. Even with a cat sleeping on my head and my dog deciding I really didn't need to move my legs and falling asleep across both of them. As it was,I stayed there as long as my bladder would let me.</amazon:domain> </speak>

Stile di pronuncia newscaster<amazon:domain name="news">

Lo stile newscaster è disponibile solo per le voci di Matthew o Joanna, in inglese americano (en-US), e diLupe, in inglese spagnolo . È supportato solo quando si utilizza il formato Neural.

Per utilizzare lo stile newscaster, utilizza i tag SSML e la sintassi seguente:


Ad esempio, puoi utilizzare lo stile newscaster con la voce di Matthew o Joanna come segue:


The maiden voyage of the White Star liner Titanic, the largest ship ever launched, has ended in disaster.


Aggiunta della compressione dinamica agli intervalli<amazon:effect name="drc">

A seconda del testo, della lingua e della voce utilizzati in un file audio, la gamma sonora varia da morbidaa forte. I suoni ambientali, ad esempio il suono di un veicolo in movimento, possono spesso mascherare isuoni più tenui. Ciò impedisce di percepire chiaramente la traccia audio. Per aumentare il volume di alcunisuoni nel tuo file audio, utilizza il tag (drc) per la compressione dinamica intervalli.

Il tag drc imposta una soglia di "sonorità" media per l'audio e aumenta il volume (il guadagno) dei suoniattorno a tale soglia. Applica l'aumento massimo di guadagno nel punto più vicino alla soglia, mentrel'aumento di guadagno diminuisce quanto più lontano dalla soglia.

133

Amazon Polly Developer GuideAggiunta della compressione dinamica agli intervalli

In questo modo, i suoni intermedi vengono uditi più facilmente in un ambiente rumoroso e ciò rende piùchiaro l'intero file audio.

Il tag drc è un parametro Booleano (o è presente o non lo è). Utilizza la sintassi: <amazon:effectname="drc"> e viene chiuso con </amazon:effect>.

È possibile utilizzare il tag drc con qualsiasi voce o lingua supportata da Amazon Polly. È possibileapplicarlo a un'intera sezione della registrazione o solo ad alcune parole. Ad esempio:

<speak> Some audio is difficult to hear in a moving vehicle, but <amazon:effect name="drc"> this audio is less difficult to hear in a moving vehicle.</amazon:effect></speak>

Note

Quando utilizzi"drc" nella sintassi , ricorda che fa distinzione tra maiuscole eminuscole.amazon:effect

Utilizzo di drc con il tag prosody volume

Come illustrato nel grafico che segue, il tag prosody volume aumenta in modo uniforme il volume di unintero file audio dal livello originale (linea punteggiata) a un livello adeguato (linea continua). Per aumentareulteriormente il volume di determinate parti del file, utilizza il tag drc con il tag prosody volume. Lacombinazione dei tag non modifica le impostazioni del tag prosody volume.

Quando utilizzi i tag drc e prosody volume insieme, Amazon Polly applica prima il tag drc aumentandoi suoni intermedi (quelli vicino alla soglia). Quindi, applica il tag prosody volume e aumenta ulteriormenteil volume dell'intera traccia audio in modo uniforme.

134

Amazon Polly Developer GuidePronuncia con un tono più morbido

Per usare i tag in combinazione, occorre nidificarli uno all'interno dell'altro. Ad esempio:

<speak> <prosody volume="loud">This text needs to be understandable and loud. <amazon:effect name="drc"> This text also needs to be more understandable in a moving car.</amazon:effect></prosody> </speak>

In questo testo, il tag prosody volume aumenta il volume dell'intero passaggio a "loud" (alto). Il tag drcottimizza il volume dei valori intermedi nella seconda frase.

Note

Quando utilizzi i tag drc e prosody volume insieme, segui le procedure XML standard per lanidificazione dei tag.


Pronuncia con un tono più morbido<amazon:effect phonation="soft">

Per specificare che il testo di input debba essere pronunciato con una voce più morbida del solito, utilizza iltag <amazon:effect phonation="soft">.

Questo utilizza la sintassi:

<amazon:effect phonation="soft">text</amazon:effect>

Ad esempio, è possibile utilizzare questo tag con la voce di Matthew come segue:

<speak> This is Matthew speaking in my normal voice. <amazon:effect phonation="soft">This is Matthew speaking in my softer voice.</amazon:effect></speak>


Controllo del timbro<amazon:effect vocal-tract-length>

Il timbro è la qualità tonale di una voce che consente di stabilire la differenza tra voci, anche quando hannola stessa intonazione e sonorità. Una delle più importanti caratteristiche fisiologiche che contribuisceal timbro della sintesi vocale è la lunghezza del tratto vocale. Il tratto vocale è una cavità di aria che siestende dalla parte superiore delle corde vocali fino al bordo delle labbra.

Per controllare il timbro dell'output vocale in Amazon Polly, utilizza il tag vocal-tract-length. Questotag ha l'effetto di modificare la lunghezza del tratto vocale dell'oratore, che suona come una modificadelle dimensioni dello stesso. Aumentando vocal-tract-length, l'oratore dà l'impressione di esserefisicamente più grande. Diminuendolo, l'oratore dà l'impressione di essere più piccolo. Puoi utilizzarequesto tag con qualsiasi voce presente nel portafoglio di sintesi vocale di Amazon Polly.

Per modificare il timbro, utilizza i seguenti valori:

135

Amazon Polly Developer GuideSussurrare

• +n% o -n%: regola la lunghezza del tratto vocale in base a una modifica percentuale relativa nella vocecorrente. Ad esempio, +4% o -2%. I valori validi sono compresi tra +100% e -50%. I valori al di fuori diquesto intervallo vengono tagliati. Ad esempio, +111% suona come+100% e -60% suona come -50%.

• n%: consente di modificare la lunghezza del tratto vocale impostando una percentuale assoluta per lalunghezza del tratto della voce corrente. Ad esempio, 110% o 75%. Un valore assoluto di 110% equivalea un valore relativo di+10%. Un valore assoluto di 100% è lo stesso valore di default per la voce corrente.

L'esempio seguente mostra come modificare la durata del tratto vocale per modificare il timbro:

<speak> This is my original voice, without any modifications. <amazon:effect vocal-tract-length="+15%"> Now, imagine that I am much bigger. </amazon:effect> <amazon:effect vocal-tract-length="-15%"> Or, perhaps you prefer my voice when I'm very small. </amazon:effect> You can also control the timbre of my voice by making minor adjustments. <amazon:effect vocal-tract-length="+10%"> For example, by making me sound just a little bigger. </amazon:effect><amazon:effect vocal-tract-length="-10%"> Or, making me sound only somewhat smaller. </amazon:effect> </speak>

Combinazione di tag multipli

È possibile combinare il tag vocal-tract-length con qualsiasi altro tag SSML supportato da AmazonPolly. Poiché il timbro (la lunghezza del tratto vocale) e l'intonazione sono strettamente connessi, èpossibile ottenere risultati ottimali utilizzando sia il tag vocal-tract-length che il tag <prosodypitch>. Per ottenere una voce più realistica, consigliamo di utilizzare diverse percentuali per i valori dimodifica dei due tag. Per ottenere i risultati desiderati, puoi fare più prove con le diverse combinazioni.

L'esempio seguente mostra come combinare i tag.

<speak> The pitch and timbre of a person's voice are connected in human speech. <amazon:effect vocal-tract-length="-15%"> If you are going to reduce the vocal tract length, </amazon:effect><amazon:effect vocal-tract-length="-15%"> <prosody pitch="+20%"> you might consider increasing the pitch, too. </prosody></amazon:effect> <amazon:effect vocal-tract-length="+15%"> If you choose to lengthen the vocal tract, </amazon:effect> <amazon:effect vocal-tract-length="+15%"> <prosody pitch="-10%"> you might also want to lower the pitch. </prosody></amazon:effect></speak>


Sussurrare<amazon:effect name="whispered">

Questo tag indica che il testo di input deve essere pronunciato con una voce sussurrata rispetto a quellautilizzata normalmente. Può essere utilizzato con qualsiasi voce presente nel portafoglio di sintesi vocale diAmazon Polly.

Questo utilizza la sintassi seguente:

<amazon:effect name=”whispered”>text</amazon:effect>

136

Amazon Polly Developer GuideSussurrare

Ad esempio:

<speak> <amazon:effect name="whispered">If you make any noise, </amazon:effect> she said, <amazon:effect name="whispered">they will hear us.</amazon:effect></speak>

In questo caso, la sintesi vocale pronunciata dal personaggio è sussurrata, mentre la frase "she said" vienepronunciata con la voce normalmente utilizzata per la sintesi vocale di Amazon Polly selezionata.

Puoi aumentare l'effetto "sussurrato" rallentando la velocità dell'elemento prosody fino al 10%, in baseall'effetto desiderato.

Ad esempio:

<speak> When any voice is made to whisper, <amazon:effect name="whispered"> <prosody rate="-10%">the sound is slower and quieter than normal speech </prosody></amazon:effect></speak>

Durante la generazione di contrassegni vocali per una voce sussurrata, il flusso audio deve includereanche la voce sussurrata per assicurare la corrispondenza con i contrassegni vocali.


137

Amazon Polly Developer GuideApplicazione di più lessici

Gestione dei lessiciI lessici di pronuncia consentono di personalizzare la pronuncia delle parole. In Amazon Polly sonodisponibili operazioni delle API che permettono di archiviare i lessici in una regione AWS. Questi lessicisaranno pertanto specifici di tale determinata regione. Puoi utilizzare uno o più lessici di quella regionequando esegui la sintesi del testo utilizzando l'operazione SynthesizeSpeech. In questo modo, il lessicospecificato viene applicato al testo di input prima dell'inizio della sintesi. Per ulteriori informazioni, consultaSynthesizeSpeech (p. 240).

Note

Questi lessici devono essere conformi alle specifiche W3C PLS (Pronunciation LexiconSpecification). Per ulteriori informazioni, consulta Pronunciation Lexicon Specification (PLS)Version 1.0 sul sito Web di W3C.

Di seguito sono elencati alcuni esempi di metodi di utilizzo dei lessici con motori di sintesi vocale:

• Talvolta le parole comuni vengono stilizzate utilizzando i numeri al posto delle lettere, come nel casodi "g3t sm4rt" (get smart). Le persone sono in grado di leggere queste parole correttamente, mentreun motore di sintesi vocale (TTS) legge il testo letteralmente, pronunciando il nome esattamente com'èscritto. In questi casi puoi utilizzare i lessici per personalizzare la sintesi vocale con Amazon Polly. Inquesto esempio, puoi specificare un alias (get smart) per il termine "g3t sm4rt" nel lessico.

• Il testo potrebbe includere un acronimo, ad esempio W3C. Puoi utilizzare un lessico per definire unalias per la parola W3C in modo che venga letta nella sua forma estesa e completa (World Wide WebConsortium).

I lessici offrono un ulteriore livello di controllo sul modo in cui Amazon Polly pronuncia le parole non comuniper la lingua selezionata. Ad esempio, puoi specificare la pronuncia utilizzando un alfabeto fonetico. Perulteriori informazioni, consulta Pronunciation Lexicon Specification (PLS) Version 1.0 sul sito Web di W3C.

Argomenti• Applicazione di più lessici (p. 138)• Gestione di lessici con la console di Amazon Polly (p. 139)• Gestione di lessici con AWS CLI (p. 142)

Applicazione di più lessiciPuoi applicare fino a cinque lessici al testo. Se lo stesso grafema appare in più lessici applicabili al testo,l'ordine in cui vengono applicati può determinare una differenza nella sintesi vocale risultante. Considera,ad esempio, il testo "Ciao, mi chiamo Bob" e due lessemi in diversi lessici che utilizzano entrambi ilgrafema Bob.

LexA

<lexeme> <grapheme>Bob</grapheme> <alias>Robert</alias></lexeme>

138

https://www.w3.org/TR/pronunciation-lexicon/



Amazon Polly Developer GuideGestione di lessici con la console

LexB

<lexeme> <grapheme>Bob</grapheme> <alias>Bobby</alias></lexeme>

Se i lessici sono elencati nell'ordine LexA seguito da LexB, la sintesi vocale sarà "Ciao, mi chiamo Robert".Se sono elencati nell'ordine LexB seguito da LexA, la sintesi vocale sarà "Ciao, mi chiamo Bobby".

Example –: applicazione di LexA prima di LexB

aws polly synthesize-speech \--lexicon-names LexA LexB \--output-format mp3 \--text 'Hello, my name is Bob' \--voice-id Justin \bobAB.mp3

Output vocale: "Ciao, mi chiamo Robert".

Example –: applicazione di LexB prima di LexA

aws polly synthesize-speech \--lexicon-names LexB LexA \--output-format mp3 \--text 'Hello, my name is Bob' \--voice-id Justin \bobBA.mp3

Output vocale: "Ciao, mi chiamo Bobby".

Per ulteriori informazioni sull'applicazione di lessici con la console di Amazon Polly, consulta Applicazionedei lessici mediante la console (sintesi vocale) (p. 140).

Gestione di lessici con la console di Amazon PollyPuoi utilizzare la console di Amazon Polly per caricare, scaricare, applicare, filtrare ed eliminare i lessici. Leseguenti procedure dimostrano ciascuno di questi processi.

Caricamento di lessici con la consolePer usare un lessico di pronuncia, è necessario prima caricarlo. Nella console è possibile caricare unlessico sia dalla scheda Text-to-Speech (Sintesi vocale) che dalla scheda Lexicons (Lessici).

Le procedure riportate di seguito mostrano come aggiungere lessici che è possibile utilizzare perpersonalizzare il modo in cui vengono pronunciate parole e frasi non comuni per la lingua scelta.

Per aggiungere un lessico dalla scheda Lexicons (Lessici)


2. Scegli la scheda Lexicons (Lessici).3. Scegli Carica.

139



Amazon Polly Developer GuideApplicazione dei lessici mediante la console (sintesi vocale)

4. Sfoglia per individuare il lessico che desideri caricare. Puoi usare solo i file PLS che utilizzanoestensioni .pls e .xml.

5. Scegli Open (Apri). Se esiste già un lessico con lo stesso nome (indipendentementedall'estensione .pls o .xml), il caricamento del lessico sovrascriverà il lessico esistente.

Per aggiungere un lessico dalla scheda Text-to-Speech (Sintesi vocale)


2. Scegli la scheda Text-to-Speech (Sintesi vocale).3. Scegli Customize pronunciation of words or phrases using lexicons (Personalizza pronuncia di parole o

frasi con i lessici), quindi scegli Upload lexicon (Carica lessico).4. Sfoglia per individuare il lessico che desideri caricare. Puoi usare solo i file PLS che utilizzano

estensioni .pls e .xml.5. Scegli Open (Apri). Se esiste già un lessico con lo stesso nome (indipendentemente

dall'estensione .pls o .xml), il caricamento del lessico sovrascriverà il lessico esistente.

Applicazione dei lessici mediante la console (sintesivocale)La procedura seguente illustra come applicare un lessico al testo di input utilizzando il lessico W3c.plsper sostituire "W3C" con "World Wide Web Consortium". Se applichi più lessici al testo, questi vengonoapplicati in ordine decrescente, con la prima corrispondenza che ha la precedenza sulle successive. Unlessico viene applicato al testo solo se la lingua specificata nel lessico corrisponde alla lingua scelta.

È possibile applicare un lessico al testo semplice o di input SSML.

Example –: applicazione del lessico W3C.pls

Per creare il lessico necessario per questo esercizio, consulta Uso dell'operazione PutLexicon (p. 142).Utilizza un editor di testo semplice per creare il lessico W3C.pls visualizzato all'inizio dell'argomento.Ricorda dove salvi il file.

Per applicare il lessico W3C.pls al testo di input

In questo esempio si introduce un lessico per sostituire "W3C" con "World Wide Web Consortium".Confronta i risultati di questo esercizio con quelli di Utilizzo di SSML (Console) (p. 111) sia per l'ingleseamericano che per un'altra lingua.


2. Scegliere una delle seguenti operazioni:

• Scegli la scheda Plain text (Testo semplice), quindi digita o incolla questo testo nell'apposita caselladi input.

He was caught up in the game. In the middle of the 10/3/2014 W3C meeting he shouted, "Score!" quite loudly.

• Scegli la scheda SSML, quindi digita o incolla questo testo nell'apposita casella di input.

<speak>He wasn't paying attention.<break time="1s"/>

140





Amazon Polly Developer GuideFiltraggio dell'elenco dei lessici con la console

In the middle of the 10/3/2014 W3C meeting he shouted, "Score!" quite loudly.</speak>

3. Nell'elenco Choose a language and region (Scegli una lingua e una regione) scegli English US(Inglese - Stati Uniti), quindi scegli la voce che desideri utilizzare per questo testo.

4. Scegli Customize pronunciation of words or phrases using lexicons (Personalizza pronuncia di parole ofrasi con i lessici).

5. Nell'elenco dei lessici scegli W3C (English, US).

Se il lessico W3C (English, US) non è elencato, scegli Upload lexicon (Carica lessico) ecaricalo, quindi sceglilo nell'elenco. Per creare questo lessico, consulta Uso dell'operazionePutLexicon (p. 142).

6. Per ascoltare immediatamente la sintesi vocale, scegli Listen to speech (Ascolta sintesi vocale).7. Per salvare la sintesi vocale in un file

a. Scegli Save speech to MP3 (Salva sintesi vocale su MP3).b. Per impostare un formato di file diverso, scegli Change file format (Modifica formato di file), scegli

il formato di file desiderato, quindi scegli Change (Modifica).

Ripeti le fasi precedenti, ma scegli una lingua diversa e osserva la differenza nell'output.

Filtraggio dell'elenco dei lessici con la consoleLa procedura riportata di seguito illustra come filtrare l'elenco dei lessici in modo che vengano visualizzatisolo i lessici di una determinata lingua.

Per filtrare i lessici elencati per lingua


2. Scegli la scheda Lexicons (Lessici).3. Scegliere Filter (Filtra).4. Nell'elenco delle lingue scegli quella per la quale desideri applicare il filtro.

Nell'elenco vengono visualizzati solo i lessici per la lingua scelta.

Scaricamento di lessici con la consoleNella procedura seguente viene descritto come scaricare uno o più lessici. Puoi aggiungere, eliminare omodificare le voci del lessico nel file, quindi caricarle di nuovo per mantenere aggiornato il lessico.

Per scaricare uno o più lessici


2. Scegli la scheda Lexicons (Lessici).3. Scegli uno o più lessici da scaricare.

a. Per scaricare un singolo lessico, scegli il nome dall'elenco.b. Per scaricare più lessici come un singolo file di archivio compresso, seleziona la casella di

controllo accanto a ogni voce nell'elenco che desideri scaricare.4. Scegli Download (Scarica).

141





Amazon Polly Developer GuideEliminazione di un lessico con la console

5. Apri la cartella in cui desideri scaricare il lessico.6. Seleziona Salva.

Eliminazione di un lessico con la consolePer eliminare un lessico

Nella procedura seguente viene descritto come eliminare un lessico. Dopo aver eliminato il lessico, deviaggiungerlo di nuovo prima di poterlo riutilizzare. Puoi eliminare uno o più lessici contemporaneamenteselezionando le caselle di controllo accanto ai singoli lessici.


2. Scegli la scheda Lexicons (Lessici).3. Scegli uno o più lessici da eliminare dall'elenco.4. Scegli Delete (Elimina).5. Scegli Delete (Elimina) per rimuovere il lessico dalla regione o Cancel (Annulla) per conservarlo.

Gestione di lessici con AWS CLII seguenti argomenti illustrano i comandi di AWS CLI necessari per gestire i lessici di pronuncia.

Argomenti• Uso dell'operazione PutLexicon (p. 142)• Uso dell'operazione GetLexicon (p. 147)• Uso delle operazioni ListLexicons (p. 147)• Uso dell'operazione DeleteLexicon (p. 148)

Uso dell'operazione PutLexiconCon Amazon Polly puoi utilizzare PutLexicon (p. 232) per archiviare i lessici di pronuncia in una regioneAWS specifica per il tuo account. Quindi, puoi specificare uno o più di questi lessici archiviati nella richiestaSynthesizeSpeech (p. 240) da applicare prima che il servizio avvii la sintesi del testo. Per ulterioriinformazioni, consulta Gestione dei lessici (p. 138).

Questa sezione fornisce lessici di esempio e istruzioni dettagliate per archiviarli e testarli.

Note

Questi lessici devono essere conformi alle specifiche W3C PLS (Pronunciation LexiconSpecification). Per ulteriori informazioni, consulta Pronunciation Lexicon Specification (PLS)Version 1.0 sul sito Web di W3C.

Esempio 1: lessico con un lessemaConsidera il seguente lessico conforme allo standard PLS W3C.

<?xml version="1.0" encoding="UTF-8"?><lexicon version="1.0" xmlns="http://www.w3.org/2005/01/pronunciation-lexicon"

142



https://www.w3.org/TR/pronunciation-lexicon/#S4.7

https://www.w3.org/TR/pronunciation-lexicon/#S4.7

Amazon Polly Developer GuidePutLexicon

xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.w3.org/2005/01/pronunciation-lexicon http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd" alphabet="ipa" xml:lang="en-US"> <lexeme> <grapheme>W3C</grapheme> <alias>World Wide Web Consortium</alias> </lexeme></lexicon>

Tieni presente quanto segue:

• I due attributi specificati nell'elemento <lexicon>:• L'attributo xml:lang specifica il codice della lingua en-US al quale si applica il lessico. Amazon Polly

può utilizzare questo lessico di esempio se la voce specificata nella chiamata SynthesizeSpeech halo stesso codice della lingua (en-US).

Note

Puoi utilizzare l'operazione DescribeVoices per trovare il codice della lingua associato auna voce.

• L'attributo alphabet specifica IPA, a indicare che per le pronunce viene utilizzato l'alfabeto fonetico

internazionale (IPA, International Phonetic Alphabet). L'IPA è uno degli alfabeti per scrivere lepronunce. Amazon Polly supporta anche l'alfabeto X-SAMPA (Extended Speech Assessment MethodsPhonetic Alphabet).

• L'elemento <lexeme> descrive la mappatura tra <grapheme> (ovvero una rappresentazione testuale

della parola) e <alias>.

Per testare questo lessico, procedi come indicato di seguito.

1. Salva il lessico con il nome example.pls.2. Eseguire il comando put-lexicondi AWS CLI per archiviare il lessico (con il nome w3c), nella

regione us-east-2.

aws polly put-lexicon \--name w3c \--content file://example.pls

3. Esegui il comando synthesize-speech per sintetizzare il testo di esempio in un flusso audio(speech.mp3) e specifica il parametro opzionale lexicon-name.

aws polly synthesize-speech \--text 'W3C is a Consortium' \--voice-id Joanna \--output-format mp3 \--lexicon-names="w3c" \speech.mp3

4. Riproduci il file speech.mp3 risultante e nota che la parola W3C nel testo è sostituita da World WideWeb Consortium.

Il lessico di esempio precedente utilizza un alias. L'alfabeto IPA menzionato nel lessico non viene utilizzato.Il lessico seguente specifica una pronuncia fonetica utilizzando l'elemento <phoneme> con l'alfabeto IPA.

143


<?xml version="1.0" encoding="UTF-8"?><lexicon version="1.0" xmlns="http://www.w3.org/2005/01/pronunciation-lexicon" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.w3.org/2005/01/pronunciation-lexicon http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd" alphabet="ipa" xml:lang="en-US"> <lexeme> <grapheme>pecan</grapheme> <phoneme>p##k##n</phoneme> </lexeme></lexicon>

Segui la stessa procedura per testare questo lessico. Assicurati di specificare il testo di input che contienela parola "noci" (ad esempio "La torta di noci è deliziosa").

Esempio 2: lessico con più lessemiIn questo esempio il lessema specificato nel lessico si applica esclusivamente al testo di input per la sintesi.Considera il lessico seguente:

<?xml version="1.0" encoding="UTF-8"?><lexicon version="1.0" xmlns="http://www.w3.org/2005/01/pronunciation-lexicon" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.w3.org/2005/01/pronunciation-lexicon http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd" alphabet="ipa" xml:lang="en-US">

<lexeme> <grapheme>W3C</grapheme> <alias>World Wide Web Consortium</alias> </lexeme> <lexeme> <grapheme>W3C</grapheme> <alias>WWW Consortium</alias> </lexeme> <lexeme> <grapheme>Consortium</grapheme> <alias>Community</alias> </lexeme></lexicon>

Il lessico specifica tre lessemi, due dei quali definiscono un alias per il grafema W3C come indicato diseguito:

• Il primo elemento <lexeme> definisce un alias (World Wide Web Consortium).• Il secondo elemento <lexeme> definisce un alias alternativo (WWW Consortium).

Amazon Polly utilizza la prima sostituzione per ogni grafema in un lessico.

Il terzo elemento <lexeme> definisce un sostituto (Community) per la parola Consortium.

In primo luogo, è opportuno testare questo lessico. Supponi di voler sintetizzare il seguente testo diesempio per un file audio (speech.mp3) e di specificare il lessico in una chiamata a SynthesizeSpeech.

The W3C is a Consortium

144


In primo luogo SynthesizeSpeech applica il lessico come segue:

• Come per il primo lessema, la parola W3C viene sostituita da World Wide Web Consortium. Il testo rivistoviene visualizzato come segue:

The World Wide Web Consortium is a Consortium

• L'alias definito nel terzo lessema si applica solo alla parola Consortium che era parte del testo originale,generando il testo seguente:

The World Wide Web Consortium is a Community.

Puoi eseguire il test utilizzando AWS CLI come indicato di seguito:

1. Salva il lessico con il nome example.pls.2. Esegui il comando put-lexicon per archiviare il lessico con il nome w3c nella regione us-east-2.

aws polly put-lexicon \--name w3c \--content file://example.pls

3. Esegui il comando list-lexicons per verificare che il lessico w3c sia incluso nell'elenco dei lessicirestituito.

aws polly list-lexicons

4. Esegui il comando synthesize-speech per sintetizzare il testo di esempio in un file audio(speech.mp3) e specifica il parametro opzionale lexicon-name.

aws polly synthesize-speech \--text 'W3C is a Consortium' \--voice-id Joanna \--output-format mp3 \--lexicon-names="w3c" \speech.mp3

5. Riproduci il file speech.mp3 risultante per verificare che la sintesi vocale rifletta le modifiche al testo.

Esempio 3: specifica di più lessiciIn una chiamata a SynthesizeSpeech puoi specificare più lessici. In questo caso, il primo lessicospecificato (da sinistra a destra) sostituisce gli eventuali lessici precedenti.

Considera i due lessici seguenti e tieni presente che ogni lessico descrive alias diversi per lo stessografema W3C.

• Lessico 1: w3c.pls

<?xml version="1.0" encoding="UTF-8"?><lexicon version="1.0" xmlns="http://www.w3.org/2005/01/pronunciation-lexicon" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.w3.org/2005/01/pronunciation-lexicon http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd" alphabet="ipa" xml:lang="en-US"> <lexeme> <grapheme>W3C</grapheme>

145


<alias>World Wide Web Consortium</alias> </lexeme></lexicon>

• Lessico 2: w3cAlternate.pls

<?xml version="1.0" encoding="UTF-8"?><lexicon version="1.0" xmlns="http://www.w3.org/2005/01/pronunciation-lexicon" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.w3.org/2005/01/pronunciation-lexicon http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd" alphabet="ipa" xml:lang="en-US">

<lexeme> <grapheme>W3C</grapheme> <alias>WWW Consortium</alias> </lexeme></lexicon>

Supponi di archiviare questi lessici con i nomi w3c e w3cAlternate, rispettivamente. Se specifichi i lessiciin ordine (w3c seguito da w3cAlternate) in una chiamata SynthesizeSpeech, l'alias per W3C definitonel primo lessico ha la precedenza sul secondo. Per testare i lessici, procedi come indicato di seguito.

1. Salva i lessici in locale in file denominati w3c.pls e w3cAlternate.pls.2. Caricare questi lessici utilizzando il comando put-lexicon di AWS CLI

• Carica il lessico w3c.pls e memorizzalo con il nome w3c.

aws polly put-lexicon \--name w3c \--content file://w3c.pls

• Carica il lessico w3cAlternate.pls nel servizio con il nome w3cAlternate.

aws polly put-lexicon \--name w3cAlternate \--content file://w3cAlternate.pls

3. Esegui il comando synthesize-speech per sintetizzare il testo di esempio in un flusso audio(speech.mp3) e specifica entrambi i lessici utilizzando il parametro lexicon-name.

aws polly synthesize-speech \--text 'PLS is a W3C recommendation' \--voice-id Joanna \--output-format mp3 \--lexicon-names '["w3c","w3cAlternative"]' \speech.mp3

4. Testa il file speech.mp3 risultante, che dovrebbe essere simile a quanto riportato di seguito:

PLS is a World Wide Web Consortium recommendation

Ulteriori esempi di codice per l'API PutLexicon• Esempio di Java: PutLexicon (p. 157)• Esempio di Python (Boto3): PutLexicon (p. 163)

146

Amazon Polly Developer GuideGetLexicon

Uso dell'operazione GetLexiconIn Amazon Polly è disponibile l'operazione dell'API GetLexicon (p. 224) per recuperare i contenuti di unlessico di pronuncia archiviato nel tuo account in una determinata regione.

Il seguente comando get-lexicon di AWS CLI recupera i contenuti del lessico example.

aws polly get-lexicon \--name example

Se nel tuo account non è ancora archiviato alcun lessico, puoi utilizzare l'operazione PutLexicon perarchiviarne uno. Per ulteriori informazioni, consulta Uso dell'operazione PutLexicon (p. 142).

Di seguito è riportata una risposta di esempio. Oltre ai contenuti del lessico, la risposta restituisce imetadata, ad esempio il codice della lingua a cui si applica il lessico, il numero di lessemi definito nellessico, l'Amazon Resource Name (ARN) della risorsa e le dimensioni del lessico in byte. Il valoreLastModified è un timestamp Unix.

{ "Lexicon": { "Content": "lexicon content in plain text PLS format", "Name": "example" }, "LexiconAttributes": { "LanguageCode": "en-US", "LastModified": 1474222543.989, "Alphabet": "ipa", "LexemesCount": 1, "LexiconArn": "arn:aws:polly:us-east-2:account-id:lexicon/example", "Size": 495 }}

Ulteriori esempi di codice per l'API GetLexicon• Esempio di Java: GetLexicon (p. 156)• Esempio di Python (Boto3): GetLexicon (p. 161)

Uso delle operazioni ListLexiconsIn Amazon Polly è disponibile l'operazione dell'API ListLexicons (p. 228) che puoi utilizzare per ottenerel'elenco di lessici di pronuncia nel tuo account in una regione AWS specifica. La seguente chiamata di AWSCLI elenca i lessici nella regione us-east-2 del tuo account.

aws polly list-lexicons

Di seguito è riportata una risposta di esempio, che mostra due lessici denominati w3c e tomato. Per ognilessico, la risposta restituisce i metadata come il codice della lingua a cui si applica il lessico, il numero dilessemi definiti nel lessico, le dimensioni in byte e così via. Il codice della lingua descrive una lingua e leimpostazioni locali a cui si applicano i lessemi definiti nel lessico.

{ "Lexicons": [ { "Attributes": {

147

Amazon Polly Developer GuideDeleteLexicon

"LanguageCode": "en-US", "LastModified": 1474222543.989, "Alphabet": "ipa", "LexemesCount": 1, "LexiconArn": "arn:aws:polly:aws-region:account-id:lexicon/w3c", "Size": 495 }, "Name": "w3c" }, { "Attributes": { "LanguageCode": "en-US", "LastModified": 1473099290.858, "Alphabet": "ipa", "LexemesCount": 1, "LexiconArn": "arn:aws:polly:aws-region:account-id:lexicon/tomato", "Size": 645 }, "Name": "tomato" } ]}

Ulteriori esempi di codice per l'API ListLexicon• Esempio di Java: ListLexicons (p. 156)• Esempio di Python (Boto3): ListLexicon (p. 162)

Uso dell'operazione DeleteLexiconIn Amazon Polly è disponibile l'operazione dell'API DeleteLexicon (p. 219) per eliminare un lessicodi pronuncia da una specifica regione AWS nel tuo account. Nell'esempio di AWS CLI seguente vieneeliminato il lessico specificato.


aws polly delete-lexicon \--name example

Ulteriori esempi di codice per l'API DeleteLexicon• Esempio di Java: DeleteLexicon (p. 154)• Esempio di Python (Boto3): DeleteLexicon (p. 161)

148

Amazon Polly Developer GuideImpostazione della policy IAM per la sintesi asincrona

Creazione di file audio lunghiPer creare file TTS per passaggi di testo lunghi, utilizza la funzionalità di sintesi asincrona di Amazon Polly.Tale funzionalità utilizza tre API SpeechSynthesisTask:

• StartSpeechSynthesisTask: avvia una nuova attività di sintesi.• GetSpeechSynthesisTask: restituisce dettagli su un'attività di sintesi inviata in precedenza.• ListSpeechSynthesisTasks: elenca tutte le attività di sintesi inviate.

L'operazione SynthesizeSpeech produce audio quasi in tempo reale, con latenza relativamente ridottanella maggior parte dei casi. A questo scopo, l'operazione può sintetizzare solo 3000 caratteri.

La funzionalità di sintesi asincrona di Amazon Polly consente di risolvere il problema dell'elaborazionedi un documento di testo di dimensioni maggiori, modificando il modo in cui il documento vienesintetizzato e restituito. Quando viene effettuata una richiesta di sintesi inviando testo di input medianteStartSpeechSynthesisTask, Amazon Polly mette in coda le richieste, quindi le elabora in modoasincrono in background non appena sono disponibili le risorse di sistema. Amazon Polly carica quindila conseguente sintesi vocale, oppure i contrassegni vocali vengono trasmessi direttamente sul bucketAmazon Simple Storage Service (Amazon S3) (obbligatorio), e notifica la disponibilità del file completatotramite l'argomento SNS (opzionale).

In questo modo, tutte le funzionalità ad eccezione dell'elaborazione quasi in tempo reale sono disponibiliper testi lunghi fino a 100.000 caratteri fatturabili (o 200.000 caratteri totali).

Per sintetizzare un documento utilizzando questo metodo, è necessario disporre di un bucket AmazonS3 scrivibile su cui è possibile salvare il file audio. Puoi ricevere una notifica quando l'audio sintetizzatoè pronto, specificando un identificatore Argomento SNS opzionale. Quando l'attività di sintesi vienecompletata, Amazon Polly pubblicherà un messaggio su tale argomento. Questo messaggio può contenereinoltre utili informazioni sugli errori nel caso in cui l'attività di sintesi non abbia avuto esito positivo. Pereseguire questa operazione, accertati che l'utente che crea l'attività di sintesi possa anche pubblicaresull'argomento SNS. Consulta la documentazione di Amazon SNS per ulteriori informazioni su come crearee sottoscrivere un argomento SNS.

Crittografia

Se lo desideri, puoi memorizzare il file di output in un modulo crittografato nel bucket S3. Per fare ciò,abilita la crittografia del bucket Amazon S3 che utilizza una delle cifrature di blocco più complessedisponibili, lo standard di crittografia avanzata a 256 bit (AES-256).

Argomenti• Impostazione della policy IAM per la sintesi asincrona (p. 149)• Creazione di file audio lunghi (console) (p. 150)• Creazione di file audio lunghi (CLI) (p. 151)

Impostazione della policy IAM per la sintesiasincrona

Per utilizzare la funzionalità di sintesi asincrona, è necessario disporre di una policy IAM che consentaquanto segue:

• utilizzo di nuove operazioni Amazon Polly• scrittura sul bucket S3 di output

149

https://docs.aws.amazon.com/sns/latest/dg/welcome.html

https://docs.aws.amazon.com/AmazonS3/latest/dev/bucket-encryption.html

Amazon Polly Developer GuideCreazione di file audio lunghi (console)

• pubblicazione sull'argomento SNS di stato [facoltativo]

La policy seguente concede solo le autorizzazioni necessarie per la sintesi asincrona e può esserecollegata all'utente IAM.

{ "Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Action": [ "polly:StartSpeechSynthesisTask", "polly:GetSpeechSynthesisTask", "polly:ListSpeechSynthesisTasks" ], "Resource": "*" }, { "Effect": "Allow", "Action": "s3:PutObject", "Resource": "arn:aws:s3:::bucket-name/*" }, { "Effect": "Allow", "Action": "sns:Publish", "Resource": "arn:aws:sns:region:account:topic" } ]}

Creazione di file audio lunghi (console)Puoi utilizzare la console di Amazon Polly per creare sintesi vocali lunghe mediante sintesi asincrona conla stessa funzionalità utilizzabile con l'interfaccia a riga di comando di AWS. Questa operazione vieneeseguita utilizzando la scheda Text-to-Speech (Sintesi vocale) in modo molto analogo a qualsiasi altrasintesi.

Anche l'altra funzionalità di sintesi asincrona è disponibile tramite la console. La scheda S3 synthesis tasks(Attività di sintesi S3) riflette la funzionalità ListSpeechSynthesisTasks visualizzando tutte le attivitàsalvate nel bucket S3 e consentendo di filtrarle in base alle esigenze. Facendo clic su una specifica attivitàsingola, ne vengono visualizzati i dettagli, in modo analogo alla funzionalità GetSpeechSynthesisTask.

Per sintetizzare un testo di grandi dimensioni mediante la console di Amazon Polly


2. Scegliere la scheda Text-to-Speech (Sintesi vocale).3. Nella scheda Plain Text (Testo normale) o la scheda SSML, digitare o incollare il testo nella casella di

input.4. Scegliere la lingua, la regione e la voce per il testo.5. Scegliere Synthesize to S3 (Sintetizza su S3).

Note

Entrambe le opzioni Download (Scarica) e Listen to Speech (Ascolta sintesi vocale) nonsaranno selezionabili se la lunghezza del testo supera i limiti consentiti per l'operazioneSynthesizeSpeech in tempo reale.

150



Amazon Polly Developer GuideCreazione di file audio lunghi (CLI)

6. Se non è stata utilizzata la sintesi asincrona in precedenza, verrà visualizzata la casella Change S3synthesis task settings (Modifica impostazioni attività di sintesi S3) in cui è possibile scegliere dovememorizzare il file di output.

a. Inserire il nome del bucket Amazon S3 di destinazione.b. Inserire facoltativamente la chiave di prefisso dell'output.

Note

Il bucket S3 di output deve essere scrivibile.c. Se si desidera ricevere una notifica quando l'attività di sintesi viene completata, specificare

l'identificatore Argomento SNS facoltativo.

Note

L'SNS deve essere aperto per la pubblicazione da parte dell'utente della consolecorrente per utilizzare questa opzione. Per ulteriori informazioni, consulta Amazon SimpleNotification Service (SNS).

d. Scegliere Synthesize (Sintetizza).

Per modificare le impostazioni delle attività di sintesi S3

1. Nella scheda Test-to-Speech (Sintesi vocale) della console, scegliere Change S3 task settings(Modifica impostazioni attività S3).

2. Apportare le modifiche desiderate al nome del bucket Amazon S3 di destinazione, la sua chiave diprefisso o l'identificatore dell'argomento SNS.

3. Al termine, scegliere Synthesize (Sintetizza).

Per recuperare informazioni sulle attività di sintesi vocale

1. Nella console, scegliere la scheda S3 Synthesis Tasks (Attività sintesi vocale).2. Le attività vengono visualizzate in ordine di data. Per filtrare le attività, scegliere Filter (Filtra), quindi

scegliere il filtro da utilizzare.3. Per visualizzare i dettagli di un'attività specifica, scegliere il Task ID (ID attività) collegato.

Creazione di file audio lunghi (CLI)La funzionalità di sintesi asincrona di Amazon Polly utilizza tre API SpeechSynthesisTask perfunzionare con grandi porzioni di testo:

• StartSpeechSynthesisTask: avvia una nuova attività di sintesi.• GetSpeechSynthesisTask: restituisce dettagli su un'attività di sintesi inviata in precedenza.• ListSpeechSynthesisTasks: elenca tutte le attività di sintesi inviate.

Sintesi di grandi porzioni di testo (StartSpeechSynthesisTask)

Quando desideri creare un file audio di dimensioni superiori rispetto a quello che puoi creare conl'operazione SynthesizeSpeech in tempo reale, utilizza l'operazione StartSpeechSynthesisTask.Oltre agli argomenti necessari per l'operazione SynthesizeSpeech, StartSpeechSynthesisTaskrichiede anche il nome di un bucket Amazon S3. Sono inoltre disponibili altri due argomenti facoltativi: unprefisso della chiave per il file di output e l'ARN per un argomento SNS se desideri ricevere la notifica distato sull'attività.

151

https://aws.amazon.com/sns/

https://aws.amazon.com/sns/


• OutputS3BucketName: il nome del bucket Amazon S3 in cui la sintesi deve essere caricata. Questobucket deve trovarsi nella stessa regione del servizio Amazon Polly. Inoltre, l'utente IAM utilizzato pereffettuare la chiamata deve avere accesso al bucket. [Obbligatorio]

• OutputS3KeyPrefix: prefisso della chiave per il file di output. Utilizza questo parametro se desiderisalvare i file di sintesi vocale di output in una chiave simile a una directory personalizzata nel tuo bucket.[Facoltativo]

• SnsTopicArn: l'ARN dell'argomento SNS da utilizzare per ricevere la notifica sullo stato dell'attività.Questo argomento SNS deve trovarsi nella stessa regione del servizio Amazon Polly. Inoltre, l'utente IAMutilizzato per effettuare la chiamata deve avere accesso all'argomento. [Facoltativo]

Ad esempio, l'istruzione seguente può essere utilizzata per eseguire il comando start-speech-synthesis-task dell'interfaccia a riga di comando di AWS nella regione Stati Uniti orientali (Ohio):


aws polly start-speech-synthesis-task \ --region us-east-2 \ --endpoint-url "https://polly.us-east-2.amazonaws.com/" \ --output-format mp3 \ --output-s3-bucket-name your-bucket-name \ --output-s3-key-prefix optional/prefix/path/file \ --voice-id Joanna \ --text file://text_file.txt

Questo determinerà una risposta simile a questa:

"SynthesisTask": { "OutputFormat": "mp3", "OutputUri": "https://s3.us-east-2.amazonaws.com/your-bucket-name/optional/prefix/path/file.<task_id>.mp3", "TextType": "text", "CreationTime": [..], "RequestCharacters": [..], "TaskStatus": "scheduled", "TaskId": [task_id], "VoiceId": "Joanna" }

L'operazione start-speech-synthesis-task restituisce diversi nuovi campi:

• OutputUri: il percorso dei file di sintesi vocale di output.• TaskId: un identificatore unico per l'attività di sintesi vocale generata da Amazon Polly.• CreationTime: un timestamp che specifica quando l'attività è stata inviata inizialmente.• RequestCharacters: il numero di caratteri fatturabili nell'attività.• TaskStatus: fornisce informazioni sullo stato dell'attività inviata.

Quando la tua attività è stata inviata, lo stato iniziale mostrerà scheduled. Quando Amazon Polly avvial'elaborazione dell'attività, lo stato passerà a inProgress e in seguito a completed o failed. Sel'attività ha esito negativo, verrà restituito un messaggio di errore durante la chiamata all'operazioneGetSpeechSynthesisTask o ListSpeechSynthesisTasks.

Una volta completata l'attività, il file di sintesi vocale è disponibile nel percorso specificato in OutputUri.

152


Recupero di informazioni sull'attività di sintesi vocale

Puoi ottenere informazioni su un'attività, ad esempio gli errori, lo stato e così via, utilizzando l'operazioneGetSpeechSynthesisTask. Per eseguire questa operazione, è necessario il task-id restituito daStartSpeechSynthesisTask.

Ad esempio, l'istruzione seguente può essere utilizzata per eseguire il comando get-speech-synthesis-task dell'interfaccia a riga di comando di AWS:

aws polly get-speech-synthesis-task \--region us-east-2 \--endpoint-url "https:// polly.us-east-2.amazonaws.com/" \--task-id task identifier

Puoi inoltre elencare tutte le attività di sintesi vocale che hai eseguito nella regione corrente utilizzandol'operazione ListSpeechSynthesisTasks.

Ad esempio, l'istruzione seguente può essere utilizzata per eseguire il comando list-speech-synthesis-tasks dell'interfaccia a riga di comando di AWS:

aws polly list-speech-synthesis-tasks \--region us-east-2 \--endpoint-url "https:// polly.us-east-2.amazonaws.com/"

153

Amazon Polly Developer GuideCodice di esempio

Esempi di codice e applicazioniIn questa sezione vengono forniti esempi di codice e applicazioni che è possibile utilizzare per esplorareAmazon Polly.

Argomenti• Codice di esempio (p. 154)• Applicazioni di esempio (p. 165)

L'argomento Codice di esempio contiene frammenti di codice organizzati in base al linguaggio diprogrammazione e separati in esempi per le diverse funzionalità di Amazon Polly. L'argomentoApplicazione di esempio contiene le applicazioni, organizzate in base al linguaggio di programmazione, chepossono essere utilizzate in modo indipendente per esplorare Amazon Polly.

Prima di iniziare a utilizzare questi esempi, è consigliabile leggere Funzionamento di Amazon Polly (p. 3) eseguire le fasi descritte in Nozioni di base su Amazon Polly (p. 4).

Codice di esempioQuesto argomento contiene esempi di codice per diverse funzionalità che possono essere utilizzate peresplorare Amazon Polly.

Codice di esempio per linguaggio di programmazione• Esempi Java (p. 154)• Esempi di Python (p. 160)

Esempi JavaI seguenti esempi di codice mostrano come utilizzare le applicazioni basate su Java per eseguire diverseattività con Amazon Polly. Questi esempi non sono completi, ma possono essere inclusi in applicazioniJava più grandi che utilizzano SDK AWS per Java.

Frammenti di codice• DeleteLexicon (p. 154)• DescribeVoices (p. 155)• GetLexicon (p. 156)• ListLexicons (p. 156)• PutLexicon (p. 157)• StartSpeechSynthesisTask (p. 158)• Contrassegni vocali (p. 159)• SynthesizeSpeech (p. 160)

DeleteLexiconIl seguente esempio di codice Java mostra come utilizzare le applicazioni basate su Java per eliminareun determinato lessico archiviato in una regione AWS. Un lessico eliminato non è disponibile per la sintesivocale, né può essere recuperato utilizzando l'API GetLexicon o ListLexicon.

Per ulteriori informazioni su questa operazione, consulta i riferimenti per l'API DeleteLexicon.

154

https://aws.amazon.com/documentation/sdk-for-java/

https://docs.aws.amazon.com/polly/latest/dg/API_DeleteLexicon.html

Amazon Polly Developer GuideEsempi Java

package com.amazonaws.polly.samples; import com.amazonaws.services.polly.AmazonPolly;import com.amazonaws.services.polly.AmazonPollyClientBuilder;import com.amazonaws.services.polly.model.DeleteLexiconRequest; public class DeleteLexiconSample { private String LEXICON_NAME = "SampleLexicon"; AmazonPolly client = AmazonPollyClientBuilder.defaultClient(); public void deleteLexicon() { DeleteLexiconRequest deleteLexiconRequest = new DeleteLexiconRequest().withName(LEXICON_NAME); try { client.deleteLexicon(deleteLexiconRequest); } catch (Exception e) { System.err.println("Exception caught: " + e); } }}

DescribeVoicesIl seguente esempio di codice Java mostra come utilizzare le applicazioni basate su Java per ottenereun elenco delle voci disponibili per l'uso al momento della richiesta di sintesi vocale. È anche possibilespecificare un codice della lingua per filtrare le voci disponibili. Se ad esempio si specifica it-IT, l'operazionerestituisce un elenco di tutte le voci disponibili per l'italiano.

Per ulteriori informazioni su questa operazione, consulta i riferimenti per l'API DescribeVoices.

package com.amazonaws.polly.samples; import com.amazonaws.services.polly.AmazonPolly;import com.amazonaws.services.polly.AmazonPollyClientBuilder;import com.amazonaws.services.polly.model.DescribeVoicesRequest;import com.amazonaws.services.polly.model.DescribeVoicesResult; public class DescribeVoicesSample { AmazonPolly client = AmazonPollyClientBuilder.defaultClient(); public void describeVoices() { DescribeVoicesRequest allVoicesRequest = new DescribeVoicesRequest(); DescribeVoicesRequest enUsVoicesRequest = new DescribeVoicesRequest().withLanguageCode("en-US"); try { String nextToken; do { DescribeVoicesResult allVoicesResult = client.describeVoices(allVoicesRequest); nextToken = allVoicesResult.getNextToken(); allVoicesRequest.setNextToken(nextToken); System.out.println("All voices: " + allVoicesResult.getVoices()); } while (nextToken != null); do { DescribeVoicesResult enUsVoicesResult = client.describeVoices(enUsVoicesRequest); nextToken = enUsVoicesResult.getNextToken(); enUsVoicesRequest.setNextToken(nextToken);

155

https://docs.aws.amazon.com/polly/latest/dg/API_DescribeVoices.html


System.out.println("en-US voices: " + enUsVoicesResult.getVoices()); } while (nextToken != null); } catch (Exception e) { System.err.println("Exception caught: " + e); } }}

GetLexiconIl seguente esempio di codice Java mostra come utilizzare le applicazioni basate su Java per ottenere ilcontenuto di un determinato lessico di pronuncia archiviato in una regione AWS.

Per ulteriori informazioni su questa operazione, consulta i riferimenti per l'API GetLexicon.

package com.amazonaws.polly.samples; import com.amazonaws.services.polly.AmazonPolly;import com.amazonaws.services.polly.AmazonPollyClientBuilder;import com.amazonaws.services.polly.model.GetLexiconRequest;import com.amazonaws.services.polly.model.GetLexiconResult; public class GetLexiconSample { private String LEXICON_NAME = "SampleLexicon"; AmazonPolly client = AmazonPollyClientBuilder.defaultClient(); public void getLexicon() { GetLexiconRequest getLexiconRequest = new GetLexiconRequest().withName(LEXICON_NAME); try { GetLexiconResult getLexiconResult = client.getLexicon(getLexiconRequest); System.out.println("Lexicon: " + getLexiconResult.getLexicon()); } catch (Exception e) { System.err.println("Exception caught: " + e); } }}

ListLexiconsIl seguente esempio di codice Java mostra come utilizzare le applicazioni basate su Java per ottenere unelenco di lessici di pronuncia archiviati in una regione AWS.

Per ulteriori informazioni su questa operazione, consulta i riferimenti per l'API ListLexicons.

package com.amazonaws.polly.samples; import com.amazonaws.services.polly.AmazonPolly;import com.amazonaws.services.polly.AmazonPollyClientBuilder;import com.amazonaws.services.polly.model.LexiconAttributes;import com.amazonaws.services.polly.model.LexiconDescription;import com.amazonaws.services.polly.model.ListLexiconsRequest;import com.amazonaws.services.polly.model.ListLexiconsResult; public class ListLexiconsSample { AmazonPolly client = AmazonPollyClientBuilder.defaultClient(); public void listLexicons() { ListLexiconsRequest listLexiconsRequest = new ListLexiconsRequest();

156

https://docs.aws.amazon.com/polly/latest/dg/API_GetLexicon.html

https://docs.aws.amazon.com/polly/latest/dg/API_ListLexicons.html


try { String nextToken; do { ListLexiconsResult listLexiconsResult = client.listLexicons(listLexiconsRequest); nextToken = listLexiconsResult.getNextToken(); listLexiconsRequest.setNextToken(nextToken); for (LexiconDescription lexiconDescription : listLexiconsResult.getLexicons()) { LexiconAttributes attributes = lexiconDescription.getAttributes(); System.out.println("Name: " + lexiconDescription.getName() + ", Alphabet: " + attributes.getAlphabet() + ", LanguageCode: " + attributes.getLanguageCode() + ", LastModified: " + attributes.getLastModified() + ", LexemesCount: " + attributes.getLexemesCount() + ", LexiconArn: " + attributes.getLexiconArn() + ", Size: " + attributes.getSize()); } } while (nextToken != null); } catch (Exception e) { System.err.println("Exception caught: " + e); } }}

PutLexiconIl seguente esempio di codice Java mostra come utilizzare le applicazioni basate su Java per archiviare unlessico di pronuncia in una regione AWS.

Per ulteriori informazioni su questa operazione, consulta i riferimenti per l'API PutLexicon.

package com.amazonaws.polly.samples; import com.amazonaws.services.polly.AmazonPolly;import com.amazonaws.services.polly.AmazonPollyClientBuilder;import com.amazonaws.services.polly.model.PutLexiconRequest; public class PutLexiconSample { AmazonPolly client = AmazonPollyClientBuilder.defaultClient();

private String LEXICON_CONTENT = "<?xml version=\"1.0\" encoding=\"UTF-8\"?>" + "<lexicon version=\"1.0\" xmlns=\"http://www.w3.org/2005/01/pronunciation-lexicon\" xmlns:xsi=\"http://www.w3.org/2001/XMLSchema-instance\" " + "xsi:schemaLocation=\"http://www.w3.org/2005/01/pronunciation-lexicon http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd\" " + "alphabet=\"ipa\" xml:lang=\"en-US\">" + "<lexeme><grapheme>test1</grapheme><alias>test2</alias></lexeme>" + "</lexicon>"; private String LEXICON_NAME = "SampleLexicon"; public void putLexicon() { PutLexiconRequest putLexiconRequest = new PutLexiconRequest() .withContent(LEXICON_CONTENT) .withName(LEXICON_NAME); try { client.putLexicon(putLexiconRequest); } catch (Exception e) { System.err.println("Exception caught: " + e); } }

157

https://docs.aws.amazon.com/polly/latest/dg/API_PutLexicon.html


}

StartSpeechSynthesisTaskIl seguente esempio di codice Java mostra come usare le applicazioni basate su Java per eseguire unasintesi vocale lunga (fino a 100.000 caratteri fatturati) e archiviarla direttamente in un bucket Amazon S3.

Per ulteriori informazioni, consulta il riferimento per l'API StartSpeechSynthesisTask.

package com.amazonaws.parrot.service.tests.speech.task;

import com.amazonaws.parrot.service.tests.AbstractParrotServiceTest;import com.amazonaws.services.polly.AmazonPolly;import com.amazonaws.services.polly.model.*;import org.awaitility.Duration;

import java.util.concurrent.TimeUnit;

import static org.awaitility.Awaitility.await;

public class StartSpeechSynthesisTaskSample {

private static final int SYNTHESIS_TASK_TIMEOUT_SECONDS = 300; private static final AmazonPolly AMAZON_POLLY_CLIENT = AmazonPollyClientBuilder.defaultClient(); private static final String PLAIN_TEXT = "This is a sample text to be synthesized."; private static final String OUTPUT_FORMAT_MP3 = OutputFormat.Mp3.toString(); private static final String OUTPUT_BUCKET = "synth-books-buckets"; private static final String SNS_TOPIC_ARN = "arn:aws:sns:eu-west-2:561828872312:synthesize-finish-topic"; private static final Duration SYNTHESIS_TASK_POLL_INTERVAL = Duration.FIVE_SECONDS; private static final Duration SYNTHESIS_TASK_POLL_DELAY = Duration.TEN_SECONDS;

public static void main(String... args) { StartSpeechSynthesisTaskRequest request = new StartSpeechSynthesisTaskRequest() .withOutputFormat(OUTPUT_FORMAT_MP3) .withText(PLAIN_TEXT) .withTextType(TextType.Text) .withVoiceId(VoiceId.Amy) .withOutputS3BucketName(OUTPUT_BUCKET) .withSnsTopicArn(SNS_TOPIC_ARN);

StartSpeechSynthesisTaskResult result = AMAZON_POLLY_CLIENT.startSpeechSynthesisTask(request); String taskId = result.getSynthesisTask().getTaskId();

await().with() .pollInterval(SYNTHESIS_TASK_POLL_INTERVAL) .pollDelay(SYNTHESIS_TASK_POLL_DELAY) .atMost(SYNTHESIS_TASK_TIMEOUT_SECONDS, TimeUnit.SECONDS) .until( () -> getSynthesisTaskStatus(taskId).equals(TaskStatus.Completed.toString()) ); }

private static SynthesisTask getSynthesisTask(String taskId) { GetSpeechSynthesisTaskRequest getSpeechSynthesisTaskRequest = new GetSpeechSynthesisTaskRequest() .withTaskId(taskId); GetSpeechSynthesisTaskResult result =AMAZON_POLLY_CLIENT.getSpeechSynthesisTask(getSpeechSynthesisTaskRequest); return result.getSynthesisTask(); }

158



private static String getSynthesisTaskStatus(String taskId) { GetSpeechSynthesisTaskRequest getSpeechSynthesisTaskRequest = new GetSpeechSynthesisTaskRequest() .withTaskId(taskId); GetSpeechSynthesisTaskResult result =AMAZON_POLLY_CLIENT.getSpeechSynthesisTask(getSpeechSynthesisTaskRequest); return result.getSynthesisTask().getTaskStatus(); }

}

Contrassegni vocaliIl seguente esempio di codice mostra come utilizzare le applicazioni basate su Java per sintetizzare icontrassegni vocali per il testo immesso. Questa funzionalità utilizza l'API SynthesizeSpeech.

Per ulteriori informazioni su questa funzionalità, consulta Contrassegni vocali (p. 103).

Per ulteriori informazioni sull'API, consulta i riferimenti per l'API SynthesizeSpeech.

package com.amazonaws.polly.samples; import com.amazonaws.services.polly.AmazonPolly;import com.amazonaws.services.polly.AmazonPollyClientBuilder;import com.amazonaws.services.polly.model.OutputFormat;import com.amazonaws.services.polly.model.SpeechMarkType;import com.amazonaws.services.polly.model.SynthesizeSpeechRequest;import com.amazonaws.services.polly.model.SynthesizeSpeechResult;import com.amazonaws.services.polly.model.VoiceId; import java.io.File;import java.io.FileOutputStream;import java.io.InputStream; public class SynthesizeSpeechMarksSample { AmazonPolly client = AmazonPollyClientBuilder.defaultClient(); public void synthesizeSpeechMarks() { String outputFileName = "/tmp/speechMarks.json"; SynthesizeSpeechRequest synthesizeSpeechRequest = new SynthesizeSpeechRequest() .withOutputFormat(OutputFormat.Json) .withSpeechMarkTypes(SpeechMarkType.Viseme, SpeechMarkType.Word) .withVoiceId(VoiceId.Joanna) .withText("This is a sample text to be synthesized."); try (FileOutputStream outputStream = new FileOutputStream(new File(outputFileName))) { SynthesizeSpeechResult synthesizeSpeechResult = client.synthesizeSpeech(synthesizeSpeechRequest); byte[] buffer = new byte[2 * 1024]; int readBytes; try (InputStream in = synthesizeSpeechResult.getAudioStream()){ while ((readBytes = in.read(buffer)) > 0) { outputStream.write(buffer, 0, readBytes); } } } catch (Exception e) { System.err.println("Exception caught: " + e);

159



} }}

SynthesizeSpeechIl seguente esempio di codice Java mostra come utilizzare le applicazioni basate su Java per eseguire lasintesi vocale con testi più corti per l'elaborazione in tempo reale.

Per ulteriori informazioni, consulta il riferimento per l'API SynthesizeSpeech.

package com.amazonaws.polly.samples; import com.amazonaws.services.polly.AmazonPolly;import com.amazonaws.services.polly.AmazonPollyClientBuilder;import com.amazonaws.services.polly.model.OutputFormat;import com.amazonaws.services.polly.model.SynthesizeSpeechRequest;import com.amazonaws.services.polly.model.SynthesizeSpeechResult;import com.amazonaws.services.polly.model.VoiceId; import java.io.File;import java.io.FileOutputStream;import java.io.InputStream; public class SynthesizeSpeechSample { AmazonPolly client = AmazonPollyClientBuilder.defaultClient(); public void synthesizeSpeech() { String outputFileName = "/tmp/speech.mp3"; SynthesizeSpeechRequest synthesizeSpeechRequest = new SynthesizeSpeechRequest() .withOutputFormat(OutputFormat.Mp3) .withVoiceId(VoiceId.Joanna) .withText("This is a sample text to be synthesized."); try (FileOutputStream outputStream = new FileOutputStream(new File(outputFileName))) { SynthesizeSpeechResult synthesizeSpeechResult = client.synthesizeSpeech(synthesizeSpeechRequest); byte[] buffer = new byte[2 * 1024]; int readBytes; try (InputStream in = synthesizeSpeechResult.getAudioStream()){ while ((readBytes = in.read(buffer)) > 0) { outputStream.write(buffer, 0, readBytes); } } } catch (Exception e) { System.err.println("Exception caught: " + e); } }}

Esempi di PythonI seguenti esempi di codice mostrano come utilizzare le applicazioni basate su Python (boto3) per eseguirediverse attività con Amazon Polly. Questi esempi non sono completi, ma possono essere inclusi inapplicazioni Python più grandi che utilizzano AWS SDK for Python (Boto).

Frammenti di codice• DeleteLexicon (p. 161)

160


https://aws.amazon.com/sdk-for-python/


• GetLexicon (p. 161)• ListLexicon (p. 162)• PutLexicon (p. 163)• StartSpeechSynthesisTask (p. 164)• SynthesizeSpeech (p. 164)

DeleteLexiconNel seguente esempio di codice Python viene utilizzato AWS SDK for Python (Boto) per eliminare unlessico nella regione specificata nella configurazione di AWS locale. Nell'esempio viene eliminato soloil lessico specificato e viene richiesto di confermare se desideri procedere prima che il lessico vengaeffettivamente eliminato.

Nell'esempio di codice seguente vengono utilizzate le credenziali di default archiviate nel file diconfigurazione dell'SDK AWS. Per informazioni sulla creazione del file di configurazione, consulta Fase 3.1:configurazione di AWS Command Line Interface (AWS CLI) (p. 7).

Per ulteriori informazioni su questa operazione, consulta i riferimenti per l'API DeleteLexicon.

from argparse import ArgumentParserfrom sys import version_info

from boto3 import Sessionfrom botocore.exceptions import BotoCoreError, ClientError

# Define and parse the command line argumentscli = ArgumentParser(description="DeleteLexicon example")cli.add_argument("name", type=str, metavar="LEXICON_NAME")arguments = cli.parse_args()

# Create a client using the credentials and region defined in the adminuser# section of the AWS credentials and configuration filessession = Session(profile_name="adminuser")polly = session.client("polly")

# Request confirmationprompt = input if version_info >= (3, 0) else raw_inputproceed = prompt((u"This will delete the \"{0}\" lexicon," " do you want to proceed? [y,n]: ").format(arguments.name))

if proceed in ("y", "Y"): print(u"Deleting {0}...".format(arguments.name))

try: # Request deletion of a lexicon by name response = polly.delete_lexicon(Name=arguments.name) except (BotoCoreError, ClientError) as error: # The service returned an error, exit gracefully cli.error(error)

print("Done.")else: print("Cancelled.")

GetLexiconNel seguente codice Python viene utilizzato AWS SDK for Python (Boto) per recuperare tutti i lessiciarchiviati in una regione AWS. Nell'esempio viene accettato un nome di lessico come parametro della riga

161

https://docs.aws.amazon.com/polly/latest/dg/API_DeleteLexicon.html


di comando e viene recuperato solo tale lessico, stampando il percorso temporaneo in cui è stato salvato inlocale.


Per ulteriori informazioni su questa operazione, consulta i riferimenti per l'API GetLexicon.

from argparse import ArgumentParserfrom os import pathfrom tempfile import gettempdir


# Define and parse the command line argumentscli = ArgumentParser(description="GetLexicon example")cli.add_argument("name", type=str, metavar="LEXICON_NAME")arguments = cli.parse_args()


print(u"Fetching {0}...".format(arguments.name))

try: # Fetch lexicon by name response = polly.get_lexicon(Name=arguments.name)except (BotoCoreError, ClientError) as error: # The service returned an error, exit gracefully cli.error(error)

# Get the lexicon data from the responselexicon = response.get("Lexicon", {})

# Access the lexicon's contentif "Content" in lexicon: output = path.join(gettempdir(), u"%s.pls" % arguments.name) print(u"Saving to %s..." % output)

try: # Save the lexicon contents to a local file with open(output, "w") as pls_file: pls_file.write(lexicon["Content"]) except IOError as error: # Could not write to file, exit gracefully cli.error(error)else: # The response didn't contain lexicon data, exit gracefully cli.error("Could not fetch lexicons contents")

print("Done.")

ListLexiconNel seguente esempio di codice Python viene utilizzato AWS SDK for Python (Boto) per elencare i lessicinel tuo account nella regione specificata nella configurazione di AWS locale. Per informazioni sullacreazione del file di configurazione, consulta Fase 3.1: configurazione di AWS Command Line Interface(AWS CLI) (p. 7).

162

https://docs.aws.amazon.com/polly/latest/dg/API_GetLexicon.html


Per ulteriori informazioni su questa operazione, consulta i riferimenti per l'API ListLexicons.

import sys



try: # Request the list of available lexicons response = polly.list_lexicons()except (BotoCoreError, ClientError) as error: # The service returned an error, exit gracefully print(error) sys.exit(-1)

# Get the list of lexicons in the responselexicons = response.get("Lexicons", [])print("{0} lexicon(s) found".format(len(lexicons)))

# Output a formatted list of lexicons with some of the attributesfor lexicon in lexicons: print((u" - {Name} ({Attributes[LanguageCode]}), " "{Attributes[LexemesCount]} lexeme(s)").format(**lexicon))

PutLexiconIl seguente esempio di codice mostra come utilizzare le applicazioni basate su Python (boto3) perarchiviare un lessico di pronuncia in una regione AWS.


Tieni presente quanto segue:

• Devi aggiornare il codice fornendo un nome file di lessico locale e un nome di lessico archiviato.• Nell'esempio si presuppone che i file di lessico sono stati creati in una sottodirectory denominata pls.

Dovrai aggiornare il percorso come opportuno.



from argparse import ArgumentParser


# Define and parse the command line argumentscli = ArgumentParser(description="PutLexicon example")cli.add_argument("path", type=str, metavar="FILE_PATH")cli.add_argument("-n", "--name", type=str, required=True, metavar="LEXICON_NAME", dest="name")arguments = cli.parse_args()

# Create a client using the credentials and region defined in the adminuser

163

https://docs.aws.amazon.com/polly/latest/dg/API_ListLexicons.html




# section of the AWS credentials and configuration filessession = Session(profile_name="adminuser")polly = session.client("polly")

# Open the PLS lexicon file for readingtry: with open(arguments.path, "r") as lexicon_file: # Read the pls file contents lexicon_data = lexicon_file.read()

# Store the PLS lexicon on the service. # If a lexicon with that name already exists, # its contents will be updated response = polly.put_lexicon(Name=arguments.name, Content=lexicon_data)except (IOError, BotoCoreError, ClientError) as error: # Could not open/read the file or the service returned an error, # exit gracefully cli.error(error)

print(u"The \"{0}\" lexicon is now available for use.".format(arguments.name))

StartSpeechSynthesisTaskNel seguente esempio di codice Python viene utilizzato AWS SDK for Python (Boto) per elencare i lessicinel tuo account nella regione specificata nella configurazione di AWS locale. Per informazioni sullacreazione del file di configurazione, consulta Fase 3.1: configurazione di AWS Command Line Interface(AWS CLI) (p. 7).

Per ulteriori informazioni, consulta il riferimento per l'API StartSpeechSynthesisTask.

import boto3import time

polly_client = boto3.Session( aws_access_key_id=’’, aws_secret_access_key=’’, region_name='eu-west-2').client('polly’)

response = polly_client.start_speech_synthesis_task(VoiceId='Joanna', OutputS3BucketName='synth-books-buckets', OutputS3KeyPrefix='key', OutputFormat='mp3', Text = 'This is a sample text to be synthesized.')

taskId = response['SynthesisTask']['TaskId']

print "Task id is {} ".format(taskId)

task_status = polly_client.get_speech_synthesis_task(TaskId = taskId)

print task_status

SynthesizeSpeechNel seguente esempio di codice Python viene utilizzato AWS SDK for Python (Boto) per elencare i lessicinel tuo account nella regione specificata nella configurazione di AWS locale. Per informazioni sullacreazione del file di configurazione, consulta Fase 3.1: configurazione di AWS Command Line Interface(AWS CLI) (p. 7).

Per ulteriori informazioni sull'API, consulta i riferimenti per l'API SynthesizeSpeech.

164



Amazon Polly Developer GuideApplicazioni di esempio

import boto3

polly_client = boto3.Session( aws_access_key_id=, aws_secret_access_key=, region_name='us-west-2').client('polly')

response = polly_client.synthesize_speech(VoiceId='Joanna', OutputFormat='mp3', Text = 'This is a sample text to be synthesized.')

file = open('speech.mp3', 'wb')file.write(response['AudioStream'].read())file.close()

Applicazioni di esempioQuesta sezione contiene ulteriori esempi, sotto forma di applicazioni di esempio che possono essereutilizzate per esplorare Amazon Polly.

Applicazioni di esempio per linguaggio di programmazione• Esempio di Python (client HTML5 e server Python) (p. 165)• Esempio di Java (p. 174)• Esempio di iOS (p. 177)• Esempio di Android (p. 178)

Esempio di Python (client HTML5 e server Python)Questa applicazione di esempio è costituita da quanto elencato di seguito:

• Un server HTTP 1.1 che utilizza la codifica di trasferimento in blocchi HTTP (vedi Codifica ditrasferimento in blocchi)

• Una semplice interfaccia utente HTML5 che interagisce con il server HTTP 1.1 (illustrata di seguito):

165

https://tools.ietf.org/html/rfc2616#section-3.6.1

https://tools.ietf.org/html/rfc2616#section-3.6.1

Amazon Polly Developer GuideEsempio di Python

L'obiettivo di questo esempio consiste nel mostrare come utilizzare Amazon Polly per lo streaming vocaleda un'applicazione HTML5 basata su browser. L'esecuzione del flusso audio prodotto da Amazon Pollydurante la sintesi del testo è l'approccio consigliato per i casi d'uso in cui i tempi di risposta costituiscono unfattore importante (ad esempio, sistemi di dialogo, programmi di lettura dello schermo e così via).

Per eseguire questa applicazione di esempio è necessario quanto elencato di seguito:

• Browser Web conforme agli standard HTML5 ed EcmaScript5 (ad esempio, Chrome 23.0 o versionesuccessiva, Firefox 21.0 o versione successiva, Internet Explorer 9.0 o versione successiva)

• Versione di Python successiva alla 3.0

Per testare l'applicazione

1. Salva il codice server con il nome server.py. Per il codice, consulta Esempio di Python: codiceserver di Python (server.py) (p. 170).

2. Salva il codice del client HTML5 con il nome index.html. Per il codice, consulta Esempio di Python:interfaccia utente HTML5 (index.html) (p. 167).

3. Esegui il comando riportato di seguito dal percorso in cui hai salvato server.py per avviarel'applicazione (in alcuni sistemi potrebbe essere necessario utilizzare python3 anziché pythonquando si esegue il comando).

$ python server.py

Dopo l'avvio dell'applicazione, un URL viene visualizzato sul terminale.4. Apri l'URL mostrato nel terminale in un browser Web.

Puoi passare l'indirizzo e la porta al server dell'applicazione in modo che li utilizzi come parametro perserver.py. Per ulteriori informazioni, esegui python server.py -h.

5. Per ascoltare la sintesi vocale, scegli una voce dall'elenco, digita del testo, quindi scegli Read. Lariproduzione della sintesi vocale viene avviata non appena Amazon Polly trasferisce i primi blocchiutilizzabili di dati audio.

6. Per arrestare il server Python al termine del test dell'applicazione, premere Ctrl+C nel terminale in cui ilserver è in esecuzione.

166


Note

Il server crea un client Boto3 utilizzando AWS SDK for Python (Boto). Il client utilizza le credenzialiarchiviate nel file di configurazione di AWS sul computer per firmare e autenticare le richiesteper Amazon Polly. Per ulteriori informazioni su come creare il file di configurazione di AWS earchiviare le credenziali, consulta Configurazione dell'interfaccia a riga di comando di AWS nellaGuida per l'utente di AWS Command Line Interface.

Esempio di Python: interfaccia utente HTML5 (index.html)Questa sezione fornisce il codice per il client HTML5 descritto in Esempio di Python (client HTML5 e serverPython) (p. 165).

<html>

<head> <title>Text-to-Speech Example Application</title> <script> /* * This sample code requires a web browser with support for both the * HTML5 and ECMAScript 5 standards; the following is a non-comprehensive * list of compliant browsers and their minimum version: * * - Chrome 23.0+ * - Firefox 21.0+ * - Internet Explorer 9.0+ * - Edge 12.0+ * - Opera 15.0+ * - Safari 6.1+ * - Android (stock web browser) 4.4+ * - Chrome for Android 51.0+ * - Firefox for Android 48.0+ * - Opera Mobile 37.0+ * - iOS (Safari Mobile and Chrome) 3.2+ * - Internet Explorer Mobile 10.0+ * - Blackberry Browser 10.0+ */

// Mapping of the OutputFormat parameter of the SynthesizeSpeech API // and the audio format strings understood by the browser var AUDIO_FORMATS = { 'ogg_vorbis': 'audio/ogg', 'mp3': 'audio/mpeg', 'pcm': 'audio/wave; codecs=1' };

/** * Handles fetching JSON over HTTP */ function fetchJSON(method, url, onSuccess, onError) { var request = new XMLHttpRequest(); request.open(method, url, true); request.onload = function () { // If loading is complete if (request.readyState === 4) { // if the request was successful if (request.status === 200) { var data;

// Parse the JSON in the response try { data = JSON.parse(request.responseText); } catch (error) {

167

https://docs.aws.amazon.com/cli/latest/userguide/cli-chap-getting-started.html


onError(request.status, error.toString()); }

onSuccess(data); } else { onError(request.status, request.responseText) } } };

request.send(); }

/** * Returns a list of audio formats supported by the browser */ function getSupportedAudioFormats(player) { return Object.keys(AUDIO_FORMATS) .filter(function (format) { var supported = player.canPlayType(AUDIO_FORMATS[format]); return supported === 'probably' || supported === 'maybe'; }); }

// Initialize the application when the DOM is loaded and ready to be // manipulated document.addEventListener("DOMContentLoaded", function () { var input = document.getElementById('input'), voiceMenu = document.getElementById('voice'), text = document.getElementById('text'), player = document.getElementById('player'), submit = document.getElementById('submit'), supportedFormats = getSupportedAudioFormats(player);

// Display a message and don't allow submitting the form if the // browser doesn't support any of the available audio formats if (supportedFormats.length === 0) { submit.disabled = true; alert('The web browser in use does not support any of the' + ' available audio formats. Please try with a different' + ' one.'); }

// Play the audio stream when the form is submitted successfully input.addEventListener('submit', function (event) { // Validate the fields in the form, display a message if // unexpected values are encountered if (voiceMenu.selectedIndex <= 0 || text.value.length === 0) { alert('Please fill in all the fields.'); } else { var selectedVoice = voiceMenu .options[voiceMenu.selectedIndex] .value;

// Point the player to the streaming server player.src = '/read?voiceId=' + encodeURIComponent(selectedVoice) + '&text=' + encodeURIComponent(text.value) + '&outputFormat=' + supportedFormats[0]; player.play(); }

// Stop the form from submitting, // Submitting the form is allowed only if the browser doesn't // support Javascript to ensure functionality in such a case event.preventDefault();

168


});

// Load the list of available voices and display them in a menu fetchJSON('GET', '/voices', // If the request succeeds function (voices) { var container = document.createDocumentFragment();

// Build the list of options for the menu voices.forEach(function (voice) { var option = document.createElement('option'); option.value = voice['Id']; option.innerHTML = voice['Name'] + ' (' + voice['Gender'] + ', ' + voice['LanguageName'] + ')'; container.appendChild(option); });

// Add the options to the menu and enable the form field voiceMenu.appendChild(container); voiceMenu.disabled = false; }, // If the request fails function (status, response) { // Display a message in case loading data from the server // fails alert(status + ' - ' + response); }); });

</script> <style> #input { min-width: 100px; max-width: 600px; margin: 0 auto; padding: 50px; }

#input div { margin-bottom: 20px; }

#text { width: 100%; height: 200px; display: block; }

#submit { width: 100%; } </style></head>

<body> <form id="input" method="GET" action="/read"> <div> <label for="voice">Select a voice:</label> <select id="voice" name="voiceId" disabled> <option value="">Choose a voice...</option> </select> </div> <div> <label for="text">Text to read:</label> <textarea id="text" maxlength="1000" minlength="1" name="text"

169


placeholder="Type some text here..."></textarea> </div> <input type="submit" value="Read" id="submit" /> </form> <audio id="player"></audio></body>

</html>

Esempio di Python: codice server di Python (server.py)Questa sezione fornisce il codice per il server di Python descritto in Esempio di Python (client HTML5 eserver Python) (p. 165).

""" Example Python 2.7+/3.3+ Application

This application consists of a HTTP 1.1 server using the HTTP chunked transfercoding (https://tools.ietf.org/html/rfc2616#section-3.6.1) and a minimal HTML5user interface that interacts with it.

The goal of this example is to start streaming the speech to the client (theHTML5 web UI) as soon as the first consumable chunk of speech is returned inorder to start playing the audio as soon as possible.For use cases where low latency and responsiveness are strong requirements,this is the recommended approach.

The service documentation contains examples for non-streaming use cases wherewaiting for the speech synthesis to complete and fetching the whole audio streamat once are an option.

To test the application, run 'python server.py' and then open the URLdisplayed in the terminal in a web browser (see index.html for a list ofsupported browsers). The address and port for the server can be passed asparameters to server.py. For more information, run: 'python server.py -h'"""from argparse import ArgumentParserfrom collections import namedtuplefrom contextlib import closingfrom io import BytesIOfrom json import dumps as json_encodeimport osimport sys

if sys.version_info >= (3, 0): from http.server import BaseHTTPRequestHandler, HTTPServer from socketserver import ThreadingMixIn from urllib.parse import parse_qselse: from BaseHTTPServer import BaseHTTPRequestHandler, HTTPServer from SocketServer import ThreadingMixIn from urlparse import parse_qs


ResponseStatus = namedtuple("HTTPStatus", ["code", "message"])

ResponseData = namedtuple("ResponseData", ["status", "content_type", "data_stream"])

# Mapping the output format used in the client to the content type for the# response

170


AUDIO_FORMATS = {"ogg_vorbis": "audio/ogg", "mp3": "audio/mpeg", "pcm": "audio/wave; codecs=1"}CHUNK_SIZE = 1024HTTP_STATUS = {"OK": ResponseStatus(code=200, message="OK"), "BAD_REQUEST": ResponseStatus(code=400, message="Bad request"), "NOT_FOUND": ResponseStatus(code=404, message="Not found"), "INTERNAL_SERVER_ERROR": ResponseStatus(code=500, message="Internal server error")}PROTOCOL = "http"ROUTE_INDEX = "/index.html"ROUTE_VOICES = "/voices"ROUTE_READ = "/read"


class HTTPStatusError(Exception): """Exception wrapping a value from http.server.HTTPStatus"""

def __init__(self, status, description=None): """ Constructs an error instance from a tuple of (code, message, description), see http.server.HTTPStatus """ super(HTTPStatusError, self).__init__() self.code = status.code self.message = status.message self.explain = description

class ThreadedHTTPServer(ThreadingMixIn, HTTPServer): """An HTTP Server that handle each request in a new thread""" daemon_threads = True

class ChunkedHTTPRequestHandler(BaseHTTPRequestHandler): """"HTTP 1.1 Chunked encoding request handler""" # Use HTTP 1.1 as 1.0 doesn't support chunked encoding protocol_version = "HTTP/1.1"

def query_get(self, queryData, key, default=""): """Helper for getting values from a pre-parsed query string""" return queryData.get(key, [default])[0]

def do_GET(self): """Handles GET requests"""

# Extract values from the query string path, _, query_string = self.path.partition('?') query = parse_qs(query_string)

response = None

print(u"[START]: Received GET for %s with query: %s" % (path, query))

try: # Handle the possible request paths if path == ROUTE_INDEX: response = self.route_index(path, query) elif path == ROUTE_VOICES: response = self.route_voices(path, query)

171


elif path == ROUTE_READ: response = self.route_read(path, query) else: response = self.route_not_found(path, query)

self.send_headers(response.status, response.content_type) self.stream_data(response.data_stream)

except HTTPStatusError as err: # Respond with an error and log debug # information if sys.version_info >= (3, 0): self.send_error(err.code, err.message, err.explain) else: self.send_error(err.code, err.message)

self.log_error(u"%s %s %s - [%d] %s", self.client_address[0], self.command, self.path, err.code, err.explain)

print("[END]")

def route_not_found(self, path, query): """Handles routing for unexpected paths""" raise HTTPStatusError(HTTP_STATUS["NOT_FOUND"], "Page not found")

def route_index(self, path, query): """Handles routing for the application's entry point'""" try: return ResponseData(status=HTTP_STATUS["OK"], content_type="text_html", # Open a binary stream for reading the index # HTML file data_stream=open(os.path.join(sys.path[0], path[1:]), "rb")) except IOError as err: # Couldn't open the stream raise HTTPStatusError(HTTP_STATUS["INTERNAL_SERVER_ERROR"], str(err))

def route_voices(self, path, query): """Handles routing for listing available voices""" params = {} voices = []

while True: try: # Request list of available voices, if a continuation token # was returned by the previous call then use it to continue # listing response = polly.describe_voices(**params) except (BotoCoreError, ClientError) as err: # The service returned an error raise HTTPStatusError(HTTP_STATUS["INTERNAL_SERVER_ERROR"], str(err))

# Collect all the voices voices.extend(response.get("Voices", []))

# If a continuation token was returned continue, stop iterating # otherwise if "NextToken" in response: params = {"NextToken": response["NextToken"]} else: break

json_data = json_encode(voices) bytes_data = bytes(json_data, "utf-8") if sys.version_info >= (3, 0) \

172


else bytes(json_data)

return ResponseData(status=HTTP_STATUS["OK"], content_type="application/json", # Create a binary stream for the JSON data data_stream=BytesIO(bytes_data))

def route_read(self, path, query): """Handles routing for reading text (speech synthesis)""" # Get the parameters from the query string text = self.query_get(query, "text") voiceId = self.query_get(query, "voiceId") outputFormat = self.query_get(query, "outputFormat")

# Validate the parameters, set error flag in case of unexpected # values if len(text) == 0 or len(voiceId) == 0 or \ outputFormat not in AUDIO_FORMATS: raise HTTPStatusError(HTTP_STATUS["BAD_REQUEST"], "Wrong parameters") else: try: # Request speech synthesis response = polly.synthesize_speech(Text=text, VoiceId=voiceId, OutputFormat=outputFormat) except (BotoCoreError, ClientError) as err: # The service returned an error raise HTTPStatusError(HTTP_STATUS["INTERNAL_SERVER_ERROR"], str(err))

return ResponseData(status=HTTP_STATUS["OK"], content_type=AUDIO_FORMATS[outputFormat], # Access the audio stream in the response data_stream=response.get("AudioStream"))

def send_headers(self, status, content_type): """Send out the group of headers for a successful request""" # Send HTTP headers self.send_response(status.code, status.message) self.send_header('Content-type', content_type) self.send_header('Transfer-Encoding', 'chunked') self.send_header('Connection', 'close') self.end_headers()

def stream_data(self, stream): """Consumes a stream in chunks to produce the response's output'""" print("Streaming started...")

if stream: # Note: Closing the stream is important as the service throttles on # the number of parallel connections. Here we are using # contextlib.closing to ensure the close method of the stream object # will be called automatically at the end of the with statement's # scope. with closing(stream) as managed_stream: # Push out the stream's content in chunks while True: data = managed_stream.read(CHUNK_SIZE) self.wfile.write(b"%X\r\n%s\r\n" % (len(data), data))

# If there's no more data to read, stop streaming if not data: break

# Ensure any buffered output has been transmitted and close the

173

Amazon Polly Developer GuideEsempio di Java

# stream self.wfile.flush()

print("Streaming completed.") else: # The stream passed in is empty self.wfile.write(b"0\r\n\r\n") print("Nothing to stream.")

# Define and parse the command line argumentscli = ArgumentParser(description='Example Python Application')cli.add_argument( "-p", "--port", type=int, metavar="PORT", dest="port", default=8000)cli.add_argument( "--host", type=str, metavar="HOST", dest="host", default="localhost")arguments = cli.parse_args()

# If the module is invoked directly, initialize the applicationif __name__ == '__main__': # Create and configure the HTTP server instance server = ThreadedHTTPServer((arguments.host, arguments.port), ChunkedHTTPRequestHandler) print("Starting server, use <Ctrl-C> to stop...") print(u"Open {0}://{1}:{2}{3} in a web browser.".format(PROTOCOL, arguments.host, arguments.port, ROUTE_INDEX))

try: # Listen for requests indefinitely server.serve_forever() except KeyboardInterrupt: # A request to terminate has been received, stop the server print("\nShutting down...") server.socket.close()

Esempio di JavaQuesto esempio mostra come utilizzare Amazon Polly per lo streaming vocale da un'applicazione basatasu Java. Nell'esempio viene utilizzato l'SDK AWS per Java per leggere il testo specificato utilizzando unavoce selezionata da un elenco.

Il codice mostrato copre le attività principali, ma esegue solo un controllo minimo degli errori. Se AmazonPolly rileva un errore, l'applicazione viene terminata.

Per eseguire questa applicazione di esempio, è necessario quanto elencato di seguito:

• Java Development Kit (JDK) di Java 8• SDK AWS per Java• Apache Maven

Per testare l'applicazione

1. Verifica che la variabile di ambiente JAVA_HOME sia impostata per il JDK.

Ad esempio, se hai installato JDK 1.8.0_121 su Windows nel percorso C:\Program Files\Java\jdk1.8.0_121, digita quanto segue al prompt dei comandi:

set JAVA_HOME=""C:\Program Files\Java\jdk1.8.0_121""

174



http://maven.apache.org/

Se hai installato JDK 1.8.0_121 su Linux nel percorso /usr/lib/jvm/java8-openjdk-amd64,digita quanto segue al prompt dei comandi:

export JAVA_HOME=/usr/lib/jvm/java8-openjdk-amd64

2. Imposta le variabili di ambiente Maven per eseguire Maven dalla riga di comando.

Ad esempio, se hai installato Maven 3.3.9 su Windows nel percorso C:\Program Files\apache-maven-3.3.9, digita quanto segue al prompt dei comandi:

set M2_HOME=""C:\Program Files\apache-maven-3.3.9""set M2=%M2_HOME%\binset PATH=%M2%;%PATH%

Se hai installato Maven 3.3.9 su Linux nel percorso /home/ec2-user/opt/apache-maven-3.3.9,digita quanto segue al prompt dei comandi:

export M2_HOME=/home/ec2-user/opt/apache-maven-3.3.9export M2=$M2_HOME/binexport PATH=$M2:$PATH

3. Crea una nuova directory denominata polly-java-demo.4. Nella directory polly-java-demo crea un nuovo file denominato pom.xml e incollavi il seguente

codice:

<project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd"> <modelVersion>4.0.0</modelVersion> <groupId>com.amazonaws.polly</groupId> <artifactId>java-demo</artifactId> <version>0.0.1-SNAPSHOT</version>

<dependencies>  <dependency> <groupId>com.amazonaws</groupId> <artifactId>aws-java-sdk-polly</artifactId> <version>1.11.77</version> </dependency>  <dependency> <groupId>com.googlecode.soundlibs</groupId> <artifactId>jlayer</artifactId> <version>1.0.1-1</version> </dependency>

</dependencies> <build> <plugins> <plugin> <groupId>org.codehaus.mojo</groupId> <artifactId>exec-maven-plugin</artifactId> <version>1.2.1</version> <executions> <execution> <goals> <goal>java</goal> </goals>

175


</execution> </executions> <configuration> <mainClass>com.amazonaws.demos.polly.PollyDemo</mainClass> </configuration> </plugin> </plugins> </build></project>

5. Crea una nuova directory denominata polly nel percorso src/main/java/com/amazonaws/demos.

6. Nella directory polly crea un nuovo file di origine Java denominato PollyDemo.java e incolla ilseguente codice:

package com.amazonaws.demos.polly;

import java.io.IOException;import java.io.InputStream;

import com.amazonaws.ClientConfiguration;import com.amazonaws.auth.DefaultAWSCredentialsProviderChain;import com.amazonaws.regions.Region;import com.amazonaws.regions.Regions;import com.amazonaws.services.polly.AmazonPollyClient;import com.amazonaws.services.polly.model.DescribeVoicesRequest;import com.amazonaws.services.polly.model.DescribeVoicesResult;import com.amazonaws.services.polly.model.OutputFormat;import com.amazonaws.services.polly.model.SynthesizeSpeechRequest;import com.amazonaws.services.polly.model.SynthesizeSpeechResult;import com.amazonaws.services.polly.model.Voice;

import javazoom.jl.player.advanced.AdvancedPlayer;import javazoom.jl.player.advanced.PlaybackEvent;import javazoom.jl.player.advanced.PlaybackListener;

public class PollyDemo {

private final AmazonPollyClient polly; private final Voice voice; private static final String SAMPLE = "Congratulations. You have successfully built this working demo of Amazon Polly in Java. Have fun building voice enabled apps with Amazon Polly (that's me!), and always look at the AWS website for tips and tricks on using Amazon Polly and other great services from AWS";

public PollyDemo(Region region) { // create an Amazon Polly client in a specific region polly = new AmazonPollyClient(new DefaultAWSCredentialsProviderChain(), new ClientConfiguration()); polly.setRegion(region); // Create describe voices request. DescribeVoicesRequest describeVoicesRequest = new DescribeVoicesRequest();

// Synchronously ask Amazon Polly to describe available TTS voices. DescribeVoicesResult describeVoicesResult = polly.describeVoices(describeVoicesRequest); voice = describeVoicesResult.getVoices().get(0); }

public InputStream synthesize(String text, OutputFormat format) throws IOException { SynthesizeSpeechRequest synthReq =

176

Amazon Polly Developer GuideEsempio di iOS

new SynthesizeSpeechRequest().withText(text).withVoiceId(voice.getId()) .withOutputFormat(format); SynthesizeSpeechResult synthRes = polly.synthesizeSpeech(synthReq);

return synthRes.getAudioStream(); }

public static void main(String args[]) throws Exception { //create the test class PollyDemo helloWorld = new PollyDemo(Region.getRegion(Regions.US_EAST_1)); //get the audio stream InputStream speechStream = helloWorld.synthesize(SAMPLE, OutputFormat.Mp3);

//create an MP3 player AdvancedPlayer player = new AdvancedPlayer(speechStream, javazoom.jl.player.FactoryRegistry.systemRegistry().createAudioDevice());

player.setPlayBackListener(new PlaybackListener() { @Override public void playbackStarted(PlaybackEvent evt) { System.out.println("Playback started"); System.out.println(SAMPLE); } @Override public void playbackFinished(PlaybackEvent evt) { System.out.println("Playback finished"); } }); // play it! player.play(); }}

7. Torna alla directory polly-java-demo per pulire, compilare ed eseguire la demo:

mvn clean compile exec:java

Esempio di iOSNel seguente esempio viene utilizzato l'SDK di iOS per consentire a Amazon Polly di leggere il testospecificato utilizzando una voce selezionata da un elenco di voci.

Il codice mostrato di seguito copre le principali attività, ma non gestisce gli errori. Per il codice completo,consulta la demo di Amazon Polly per SDK AWS per iOS.

Inizializzazione

// Region of Amazon Polly.let AwsRegion = AWSRegionType.usEast1 // Cognito pool ID. Pool needs to be unauthenticated pool with// Amazon Polly permissions.let CognitoIdentityPoolId = "YourCognitoIdentityPoolId" // Initialize the Amazon Cognito credentials provider.let credentialProvider = AWSCognitoCredentialsProvider(regionType: AwsRegion, identityPoolId: CognitoIdentityPoolId)

177

https://github.com/awslabs/aws-sdk-ios-samples/tree/master/Polly-Sample/Swift

Amazon Polly Developer GuideEsempio di Android

// Create an audio playervar audioPlayer = AVPlayer()

Visualizza elenco di voci disponibili

// Use the configuration as defaultAWSServiceManager.default().defaultServiceConfiguration = configuration

// Get all the voices (no parameters specified in input) from Amazon Polly// This creates an async task.let task = AWSPolly.default().describeVoices(AWSPollyDescribeVoicesInput()) // When the request is done, asynchronously do the following block// (we ignore all the errors, but in a real-world scenario they need// to be handled)task.continue(successBlock: { (awsTask: AWSTask) -> Any? in // awsTask.result is an instance of AWSPollyDescribeVoicesOutput in // case of the "describeVoices" method let voices = (awsTask.result! as AWSPollyDescribeVoicesOutput).voices return nil})

Sintesi vocale

// First, Amazon Polly requires an input, which we need to prepare.// Again, we ignore the errors, however this should be handled in// real applications. Here we are using the URL Builder Request,// since in order to make the synthesis quicker we will pass the// presigned URL to the system audio player.let input = AWSPollySynthesizeSpeechURLBuilderRequest()

// Text to synthesizeinput.text = "Sample text"

// We expect the output in MP3 formatinput.outputFormat = AWSPollyOutputFormat.mp3

// Choose the voice IDinput.voiceId = AWSPollyVoiceId.joanna

// Create an task to synthesize speech using the given synthesis inputlet builder = AWSPollySynthesizeSpeechURLBuilder.default().getPreSignedURL(input)

// Request the URL for synthesis resultbuilder.continueOnSuccessWith(block: { (awsTask: AWSTask<NSURL>) -> Any? in // The result of getPresignedURL task is NSURL. // Again, we ignore the errors in the example. let url = awsTask.result!

// Try playing the data using the system AVAudioPlayer self.audioPlayer.replaceCurrentItem(with: AVPlayerItem(url: url as URL)) self.audioPlayer.play()

return nil})

Esempio di AndroidNel seguente esempio viene utilizzato l'SDK di Android per consentire a Amazon Polly di leggere il testospecificato utilizzando una voce selezionata da un elenco di voci.

178


Il codice mostrato di seguito copre le principali attività, ma non gestisce gli errori. Per il codice completo,consulta la demo di Amazon Polly per SDK AWS per Android.

Inizializzazione

// Cognito pool ID. Pool needs to be unauthenticated pool with// Amazon Polly permissions.String COGNITO_POOL_ID = "YourCognitoIdentityPoolId";

// Region of Amazon Polly.Regions MY_REGION = Regions.US_EAST_1; // Initialize the Amazon Cognito credentials provider.CognitoCachingCredentialsProvider credentialsProvider = new CognitoCachingCredentialsProvider( getApplicationContext(), COGNITO_POOL_ID, MY_REGION);

// Create a client that supports generation of presigned URLs.AmazonPollyPresigningClient client = new AmazonPollyPresigningClient(credentialsProvider);

Visualizza elenco di voci disponibili

// Create describe voices request.DescribeVoicesRequest describeVoicesRequest = new DescribeVoicesRequest();

// Synchronously ask Amazon Polly to describe available TTS voices.DescribeVoicesResult describeVoicesResult = client.describeVoices(describeVoicesRequest);List<Voice> voices = describeVoicesResult.getVoices();

Visualizzazione dell'URL per lo streaming audio

// Create speech synthesis request.SynthesizeSpeechPresignRequest synthesizeSpeechPresignRequest = new SynthesizeSpeechPresignRequest() // Set the text to synthesize. .withText("Hello world!") // Select voice for synthesis. .withVoiceId(voices.get(0).getId()) // "Joanna" // Set format to MP3. .withOutputFormat(OutputFormat.Mp3);

// Get the presigned URL for synthesized speech audio stream.URL presignedSynthesizeSpeechUrl = client.getPresignedSynthesizeSpeechUrl(synthesizeSpeechPresignRequest);

Riproduzione dell'audio sintetizzato

// Use MediaPlayer: https://developer.android.com/guide/topics/media/mediaplayer.html

// Create a media player to play the synthesized audio stream.MediaPlayer mediaPlayer = new MediaPlayer();mediaPlayer.setAudioStreamType(AudioManager.STREAM_MUSIC);

try { // Set media player's data source to previously obtained URL. mediaPlayer.setDataSource(presignedSynthesizeSpeechUrl.toString());} catch (IOException e) { Log.e(TAG, "Unable to set data source for the media player! " + e.getMessage());

179

https://github.com/awslabs/aws-sdk-android-samples/tree/master/PollyDemo


}

// Prepare the MediaPlayer asynchronously (since the data source is a network stream).mediaPlayer.prepareAsync();

// Set the callback to start the MediaPlayer when it's prepared.mediaPlayer.setOnPreparedListener(new MediaPlayer.OnPreparedListener() { @Override public void onPrepared(MediaPlayer mp) { mp.start(); }});

// Set the callback to release the MediaPlayer after playback is completed.mediaPlayer.setOnCompletionListener(new MediaPlayer.OnCompletionListener() { @Override public void onCompletion(MediaPlayer mp) { mp.release(); }});

180

Amazon Polly Developer GuideInstallazione e configurazione di

Amazon Polly per Windows (SAPI)

Amazon Polly per le applicazionicompatibili con Windows SAPI

Con il plugin Amazon Polly per Windows, Amazon Polly fornisce funzionalità di sintesi vocale notevolmenteampliate per applicazioni Windows compatibili con Speech Application Programming Interface (SAPI). SAPIè un'API di Microsoft Windows che consente alle applicazioni desktop di generare sintesi vocali.

Windows fornisce una voce maschile e una femminile che può essere utilizzata con per l'API SAPI. Conil plug-in Amazon Polly per Windows, l'applicazione Windows diventa un client AWS, consentendotidi utilizzare tutte le voci Amazon Polly, incluse quelle standard e neurali, nonché lo stile di pronuncianewscaster. Il plugin Amazon Polly per Windows supporta solo applicazioni SAPI a 64 bit.

Amazon Polly per Windows supporta tutte le caratteristiche Amazon Polly, ad esempio Speech SynthesisMarkup Language (SSML). Quando si utilizza SSML con il plugin, è disponibile la funzionalità standarde si applicano i limiti standard. Per ulteriori informazioni sull'uso di SSML con Amazon Polly, consultaGenerazione di input vocale da documenti SSML (p. 109). Per ulteriori informazioni sui limiti, consultaQuote in Amazon Polly (p. 194).

Argomenti• Installazione e configurazione di Amazon Polly per Windows (SAPI) (p. 181)• Utilizzo di Amazon Polly nelle applicazioni (p. 183)

Installazione e configurazione di Amazon Polly perWindows (SAPI)

Per installare e configurare il plugin Amazon Polly per Windows (SAPI), è necessario un account AWS. Senon disponi di un account, consulta Fase 1.1: registrazione ad AWS (p. 4).

Argomenti• Creazione di un utente IAM per il client AWS (p. 181)• Installazione di AWS CLI per Windows (p. 182)• Creazione di un profilo per il client AWS (p. 182)• Installazione del plug-in Amazon Polly per Windows (p. 183)

Creazione di un utente IAM per il client AWSPrima di connettere il client AWS all'account AWS, è necessario creare un utente Identity and AccessManagement (IAM) per il client, quindi collegare una policy di autorizzazioni a tale utente. Un utente IAM èuna persona o un’applicazione in un account AWS che può effettuare chiamate API a prodotti AWS.

Il client AWS utilizza il servizio Amazon Polly, pertanto ha bisogno della policy di autorizzazioniAmazonPollyReadOnlyAccess.

181

Amazon Polly Developer GuideInstallazione di AWS CLI per Windows

Per creare un utente IAM

1. Accedi alla Console di gestione AWS e apri la console IAM.2. Scegli Users (Utenti).3. Scegli Add User (Aggiungi utente).4. In User name (Nome utente), immetti polly-windows-user.5. In Access Type (Tipo di accesso), scegliere Programmatic access (Accesso programmatico),quindi

Next: Permissions (Successivo: autorizzazioni).6. Scegli Attach existing policies directly (Collega direttamente le policy esistenti)7. Nella casella di ricerca immetti polly.8. Scegli AmazonPollyReadOnlyAccess.9. Scegliere Next: Tags (Successivo: Tag).10. Scegli Next:Review (Successivo:Rivedi).11. Scegli Create User (Crea utente).12. Registrare l'ID chiave di accesso e la chiave di accesso segreta. Sono necessarie per configurare il

client AWS.

Important

Questa è l'unica volta in cui puoi accedere a queste chiavi, pertanto assicurati di registrarle.

Installazione di AWS CLI per WindowsL'interfaccia a riga di comando di AWS (AWS CLI) è uno strumento open source che consente di interagirecon i servizi AWS utilizzando i comandi del prompt dei comandi di Windows. Per installare AWS CLI,consulta la sezione relativa all'installazione di AWS CLI su Windows nella Guida per l'utente dell'interfacciaa riga di comando di AWS.

Creazione di un profilo per il client AWSIl plugin Amazon Polly per Windows richiede un profilo AWS denominato polly-windows. Questo profilogarantisce che il motore Amazon Polly utilizzi l'account corretto.

Per creare il profilo polly-windows per il client AWS

1. In Windows, aprire un prompt dei comandi.2. Al prompt dei comandi, eseguire il comando aws configure --profile polly-windows.3. Quando viene richiesto di immettere AWS Access Key ID (ID chiave di accesso AWS) e AWS Secret

Access Key (Chiave di accesso segreta AWS), immettere i valori salvati al momento della creazionedell'utente IAM .

4. Per Default region (Regione predefinita), immettere il nome della regione AWS desiderata in lettereminuscole.

Note

Non tutte le voci e caratteristiche Amazon Polly sono disponibili in tutte le regioni AWS. Perulteriori informazioni, consulta Caratteristiche e compatibilità delle regioni (p. 95).

5. Per Default output format (Formato di output predefinito), premere Invio.6. Al prompt dei comandi, verificare il profilo eseguendo il comando aws --profile polly-windows

polly describe-voices. Se il profilo è stato creato correttamente, AWS CLI visualizza un elencodi nomi Amazon Polly disponibili.

182

https://console.aws.amazon.com/iam/

https://docs.aws.amazon.com/cli/latest/userguide/install-windows.html

Amazon Polly Developer GuideInstallazione del plug-in Amazon Polly per Windows

Installazione del plug-in Amazon Polly per WindowsInstalla il plugin Amazon Polly per Windows scaricandolo da Amazon Simple Storage Service (Amazon S3)ed eseguendo il programma di installazione. Dopo aver installato il plugin, puoi utilizzare le voci AmazonPolly in tutte le applicazioni Windows che utilizzano l'API SAPI.

Note

Se si prevede di utilizzare una voce neurale nell'applicazione SAPI, assicurarsi che il client siaconfigurato per una regione AWS che supporti NTTS prima di installare il plugin per Windows. Perulteriori informazioni, consulta Caratteristiche e compatibilità delle regioni (p. 95).

Per installare il plugin Amazon Polly per Windows

1. In Windows, scarica il plugin.2. Decomprimi la cartella.3. Esegui AmazonPollyForWindowsSetup.exe.4. In Control Panel (Pannello di controllo), cerca speech settings.5. In Text-to-speech (Sintesi vocale), per Voice (Voce), scegli una voce Amazon Polly.6. Scegli Preview Voice (Anteprima voce).

Utilizzo di Amazon Polly nelle applicazioniDopo aver installato il plugin Amazon Polly per Windows, è possibile accedere alle voci Amazon Pollyda qualsiasi applicazione Windows che implementa Windows SAPI. Per utilizzare una voce, selezionaladall'elenco di voci Amazon Polly nell'applicazione. Per un elenco completo delle voci disponibili, consultaVoci disponibili (p. 12).

Per un esempio di come utilizzare voci Amazon Polly in un'applicazione Windows (Adobe Captivate),consulta Utilizzo di Amazon Polly in applicazioni Windows nel blog AWS Machine Learning.

Per utilizzare voci Amazon Polly in un'applicazione Windows, puoi utilizzare PollyPlayer. PollyPlayer è unasemplice applicazione di sintesi vocale di Windows che viene installata durante l'installazione del pluginAmazon Polly per Windows.

Per utilizzare PollyPlayer

1. Nel menu Start di Windows, in Amazon Polly per Windows, scegliere PollyPlayer.2. Nell'applicazione PollyPlayer, scegliere una voce, quindi immettere il testo che si desidera ascoltare.

183

samples/AmazonPollyForWindowsSetup.zip

https://aws.amazon.com/blogs/machine-learning/tag/amazon-polly/

Amazon Polly Developer GuideUtilizzo di Amazon Polly nelle applicazioni

184

Amazon Polly Developer GuideUtilizzo di Amazon Polly nelle applicazioni

3. Per ascoltare il testo, scegliere Say it (Pronuncia).

185

Amazon Polly Developer GuidePrerequisiti di installazione

Il plugin AWS per WordPressCon il plugin AWS per WordPress, è possibile impostare diversi servizi AWS, tra cui Amazon Polly. ConAmazon Polly, è possibile fornire ai visitatori del sito Web WordPress registrazioni audio dei tuoi contenuti.Utilizza il plugin per creare file audio in una qualsiasi delle voci e delle lingue supportate da Amazon Polly. Ituoi visitatori possono trasmettere l'audio a loro piacimento utilizzando lettori audio inline e applicazioni perdispositivi mobili.

Puoi configurare il plugin in modo da poter effettuare le operazioni seguenti:

• Creare automaticamente registrazioni audio per il nuovo contenuto al momento della pubblicazione oscegliere di creare registrazioni per singoli post

• Creare registrazioni audio per il contenuto archiviato• Utilizzare i feed RSS di Amazon Pollycast per realizzare podcast del contenuto audio

Argomenti• Prerequisiti di installazione (p. 186)• Installazione e configurazione del plugin (p. 188)• Personalizzazione della pagina di WordPress (p. 190)• Riproduzione di podcast con Amazon Pollycast (p. 192)• Archiviazione dei file audio (p. 193)

Prerequisiti di installazionePer utilizzare il plugin AWS per WordPress, è necessario un account AWS, un utente AWS Identity andAccess Management (IAM) e un sito Web WordPress.

Argomenti• Creazione di un account AWS (p. 186)• Creazione di un utente IAM (p. 186)• Creazione di un sito Web WordPress (p. 188)

Creazione di un account AWSSe già disponi di un account AWS, puoi ignorare questa sezione. Altrimenti creane uno.

Per creare un account AWS

1. Aprire https://portal.aws.amazon.com/billing/signup.2. Seguire le istruzioni online.

Come parte della procedura di registrazione riceverai una telefonata, durante la quale dovrai inserireun codice di verifica sulla tastiera del telefono.

Creazione di un utente IAMPer utilizzare il plugin AWS per WordPress, è necessario creare un utente IAM per il plugin. Un utenteIAM è una persona o un'applicazione con un account AWS che dispone dell'autorizzazione per effettuarechiamate API ai servizi AWS.

186

https://portal.aws.amazon.com/billing/signup

Amazon Polly Developer GuideCreazione di un utente IAM

Note

Se non si utilizza WordPress.com e invece si dispone di un sito Web WordPress con hostingautonomo su Amazon EC2, è possibile utilizzare un ruolo IAM anziché un utente IAM. Per ulterioriinformazioni, consulta IAM Ruoli Amazon EC2 nella Guida per l'utente di Amazon EC2.

La procedura seguente contiene le fasi per creare una policy IAM e quindi collegarla all'utente IAM. Unapolicy IAM è un documento che definisce le autorizzazioni applicabili all'utente.

Per creare un utente IAM

1. Accedi alla Console di gestione AWS e apri la console IAM all'indirizzo https://console.aws.amazon.com/iam/.

2. Nel riquadro di navigazione scegli Policies (Policy). Quindi scegliere Create policy (Crea policy).3. Scegli JSON.4. Eliminare tutto il contenuto della casella di testo della policy e quindi incollare o immettere la seguente

policy JSON nella casella di testo:

{ "Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Action": "acm:DeleteCertificate", "Resource": "*", "Condition": { "StringEquals": { "aws:RequestedRegion": "us-east-1" } } } ]}

5. Scegliere Review policy (Esamina policy).6. Nella pagina Review Policy (Rivedi policy), effettua le operazioni seguenti:

a. In Name (Nome), immettere AWSForWordPressDeleteCert.b. Seleziona Create Policy (Crea policy).

7. Nel riquadro di navigazione, seleziona Users (Utenti). Scegli Add user (Aggiungi utente).8. Nella pagina Set user details (Imposta dettagli utente) eseguire le operazioni seguenti:

a. In User name (Nome utente), immettere AWSForWordPressPlugin.b. In Access type (Tipo di accesso), scegliere Programmatic access (Accesso programmatico).c. Scegliere Next: Permissions (Successivo: Autorizzazioni).

9. Nella pagina Set Permissions (Imposta autorizzazioni), procedere nel modo seguente:

a. Scegli Attach existing policies directly (Collega direttamente le policy esistenti).b. Nella casella di ricerca immettere WordPress, e quindi selezionare le caselle di controllo accanto

a AWSForWordPressPolicy e AWSForWordPressDeleteCert. Assicurati di selezionare le caselledi controllo per entrambe le policy di WordPress.

Note

AWSForWordPressPolicy è una policy gestita AWS che consente all'utente di utilizzaretutte le caratteristiche incluse nel plugin AWS per WordPress. Quando vengono

187

https://wordpress.com/

https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/iam-roles-for-amazon-ec2.html



Amazon Polly Developer GuideCreazione di un sito Web WordPress

aggiunte nuove caratteristiche al plugin, AWS aggiornerà questa policy per includere leautorizzazioni necessarie per utilizzare le nuove caratteristiche.

c. Scegliere Next: Tags (Successivo: Tag).10. Scegli Next:Review (Successivo:Rivedi).11. Selezionare Create user (Crea utente).12. Scegliere Download .csv (Scarica .csv) per salvare le credenziali dell'utente (ID chiave di accesso

e chiave di accesso segreta) nel computer. Ciò è necessario per configurare il plugin AWS perWordPress.

Important

Questa è l'unica volta in cui è possibile salvare la chiave di accesso segreta dell'utente, quindiassicurarsi di salvarla ora.

Creazione di un sito Web WordPressSe si dispone già di un sito Web WordPress, è possibile passare direttamente a Installazione econfigurazione del plugin (p. 188).

Se non si dispone di un sito Web WordPress, è possibile crearne uno utilizzando WordPress.com. Perutilizzare il plugin AWS per WordPress, è necessario un piano Business o eCommerce di WordPress.com.

È inoltre possibile installare il software WordPress sul proprio server Web, utilizzando Amazon Lightsail,Amazon EC2 o un'altra piattaforma di hosting Web. Ospitare il proprio sito Web WordPress comporta piùfasi rispetto all'utilizzo di WordPress.com e richiede la capacità di configurare e gestire un server Web, unsistema di bilanciamento del carico, i record DNS e i certificati del server Web.

Indipendentemente da come si imposta il sito Web WordPress, è necessario quanto segue prima di poterutilizzare il plugin AWS per WordPress:

• Il sito Web deve avere il proprio nome di dominio. Un nome di dominio, noto anche come indirizzoWeb o URL (Uniform Resource Locator), è l'indirizzo che i visitatori utilizzano per accedere al sitoWeb. Ad esempio, il nome di dominio di Amazon è amazon.com. In questo argomento viene utilizzatoexample.com come nome di dominio di esempio generico, ma per il sito Web è necessario un nome didominio personalizzato.

• Il sito Web deve funzionare con HTTPS. Questa è una best practice per la sicurezza e il pluginpresuppone che il sito Web funzioni utilizzando HTTPS. Per verificare, vai all'indirizzo del sito Webutilizzando HTTPS (ad esempio, https://example.com) e assicurati che il tuo sito Web venga visualizzatocorrettamente.

Quando il sito Web ha un nome di dominio e funziona con HTTPS, passare alla sezione seguente.

Installazione e configurazione del pluginPrima di installare il plugin, assicurarsi di completare i prerequisiti (p. 186).

Per installare il plugin

1. Accedi al pannello di controllo per amministratori del sito Web WordPress, noto anche come WPAdmin.

2. Scegli Plugins (Plugin).3. Scegliere Add new (Aggiungi nuovo).

188

https://wordpress.com/

Amazon Polly Developer GuideConfigurazione del plugin

4. Nella casella di ricerca immetti AWS for WordPress.5. Trova il plugin AWS per WordPress. Scegliere Install Now (Installa ora), quindi scegliere Activate

(Attiva).

Configurazione del pluginDopo aver installato il plugin AWS per WordPress configuralo per abilitare il podcasting, posizioni di storagealternative e altre opzioni.

Note

Nella procedura seguente, i nomi dei campi e dei comandi potrebbero essere leggermente diversidai nomi utilizzati in WordPress.

Per configurare il plugin

1. Nella pagina WordPress Admin (Amministratore WordPress), selezionare Settings (Impostazioni).2. Configurare il plugin mediante le seguenti opzioni:

• AWS access key and AWS secret key (Chiave di accesso AWS e chiave segreta AWS): questecredenziali di AWS consentono al plugin di utilizzare Amazon Polly e Amazon Simple StorageService (Amazon S3). Digita le chiavi segrete e di accesso AWS create in precedenza. Se il sitoWordPress è ospitato su Amazon EC2, puoi utilizzare un ruolo IAM anziché le credenziali. In questocaso, lascia questi due campi vuoti.

• Sample rate (Frequenza di campionamento): la frequenza di campionamento dei file audio generatain Hz. Frequenze di campionamento superiori producono audio di maggiore qualità.

• Voice name (Nome voce): La voce di Amazon Polly da utilizzare nel file audio.

Note

Ricorda che la scelta della voce è determinata dalla lingua che stai utilizzando. Per unelenco completo delle voci disponibili, consulta Voci disponibili (p. 12).

• Player position (Posizione lettore): posizione del lettore audio sul sito Web. Puoi inserirlo prima odopo il post o non utilizzarlo. Se desideri rendere i tuoi file disponibili come podcast tramite AmazonPollycast, non visualizzare il lettore audio.

• New post default (Impostazione predefinita nuovi post): specifica se Amazon Polly deve creareautomaticamente un file audio per tutti i nuovi post. Scegliere questa opzione se si desidera cheAmazon Polly crei un file audio per ogni nuovo post.

• Autoplay (Riproduzione automatica): specifica se il lettore audio avvia automaticamente lariproduzione dell'audio per un post quando un utente lo visita.

• Store audio in Amazon S3 (Archivia audio in Amazon S3): se desideri archiviare i file audio in unbucket S3 Amazon Pollyanziché sul server Web, scegli questa opzione. Amazon Polly crea il bucketper tuo conto. Per ulteriori informazioni e per visualizzare i prezzi, consulta Amazon S3.

• Amazon CloudFront (CDN) domain name (Nome dominio (CDN) Amazon CloudFront): se vuoitrasmettere i tuoi file audio con Amazon CloudFront, fornisci il nome del tuo dominio CloudFront. Ilplugin utilizza il dominio per lo streaming audio. Se non hai già un dominio, creane uno in AmazonCloudFront.

• ITunes category (Categoria ITunes): la categoria del tuo podcast. Scegliere una categoria semplificaper gli utenti di podcast la ricerca del tuo podcast nel catalogo.

• ITunes explicit (Esplicito per iTunes): specifica se abilitare il podcasting Amazon Pollycast conl'impostazione esplicita per iTunes.

• Bulk update all posts (Aggiornamento in blocco di tutti i post): se si desidera convertire tutti i postWordPress precedenti in modo che utilizzino il plugin AWS for WordPress (AWS per WordPress)scegliere questa opzione.

189

https://aws.amazon.com/s3

Amazon Polly Developer GuidePersonalizzazione di WordPress

3. Selezionare Save Changes.

Personalizzazione della pagina di WordPressÈ possibile utilizzare diverse opzioni per la personalizzazione dei contenuti WordPress per utilizzarli inmodo più efficiente con il plugin di Amazon Polly per WordPress:

• Regolazione delle impostazioni di plugin per ottimizzare i file audio (p. 190)• Utilizzare SSML nei contenuti per modificare il modo in cui verrà pronunciato (p. 190)• Utilizzo di tag Solo Audio e Solo Parola nei contenuti (p. 190)

Regolazione delle impostazioni di plugin perottimizzare i file audioLe impostazioni del plugin AWS per WordPress offrono tre opzioni che consentono di personalizzare ilsuono del testo di WordPress per il file audio:

• Voice name (Nome voce): il nome della voce e la lingua selezionati consentono di selezionare il sessodella voce di Amazon Polly. Le singole voci sono disponibili per ogni lingua e si dispone di diverseopzioni per ogni sesso in molte lingue. Per ulteriori informazioni, consulta Voci in Amazon Polly (p. 12).

• Automated breaths (Respiri automatici): se abilitata, Amazon Polly inserisce automaticamente i respirinel contenuto nei punti appropriati. L'impostazione di questa opzione consentirà solo di utilizzare respiriautomatici e non di impostarli manualmente. Per ulteriori informazioni, consulta Respirazione automatica.

• Velocità audio: questa opzione consente di modificare la velocità di consegna della versione audio deituoi contenuti, dal 20% al 200% della velocità predefinita della voce.

Utilizzare SSML nei contenuti per modificare il modo incui verrà pronunciatoAmazon Polly supporta più tag SSML che consentono di controllare molti aspetti del modo in cui AmazonPolly genera discorso dal testo fornito. Per ulteriori informazioni su SSML e Amazon Polly, consultaTag SSML supportati (p. 116). Alcuni di questi tag sono ripresi nelle impostazioni di plug-in durante laconfigurazione del plug-in. Al momento, tuttavia, solo il tag <break> è disponibile per l'uso diretto nel pluginAWS per WordPress.

Il tag <break > consente di aggiungere una pausa nella versione parlata del testo. È possibile regolare lalunghezza di questa pausa per soddisfare le tue esigenze specifiche. La lunghezza predefinita della pausaè pari alla pausa seguendo una virgola. Per ulteriori informazioni sul tag <break>, consulta Tag SSMLsupportati (p. 116).

Per utilizzare i tag SSML per migliorare il tuo testo su WordPress, l'opzione di supporto Enable SSML(Abilita SSML) deve essere selezionata nelle impostazioni di Amazon Polly nella pagina WordPress Admin(Amministratore WordPress). Store audio in Amazon S3 option (Opzione archivia audio in Amazon S3)deve essere selezionata in quanto i file audio con tag SSML devono essere archiviati in un bucket S3.

Utilizzo di tag Solo Audio e Solo Parola nei contenutiA volte si desidera aggiungere qualcosa al proprio podcast audio ma si desidera che non vengavisualizzato nel browser. O si desidera mostrare qualcosa nel browser, ma non nel file audio. A tale scopo

190

https://docs.aws.amazon.com/polly/latest/dg/supportedtags.html#breath-tag

Amazon Polly Developer GuideAggiunta di testo tradotto ai propri post

è possibile utilizzare i tag Audio Only e Word Only, che vengono inseriti nei contenuti di WordPress percontrollare quale parte del testo verrà visualizzata o parlata.

Per convertire il testo in audio ma non visualizzarlo nel browser

1. Isolare il testo selezionato sulla pagina WordPress posizionando una riga vuota sopra e sotto.2. Sulla riga sopra il testo selezionato, inserire il seguente tag:

-AMAZONPOLLY-ONLYAUDIO-START-

3. Sulla riga dopo il testo, inserire il seguente tag:

-AMAZONPOLLY-ONLYAUDIO-END-

È possibile utilizzare la stessa procedura per visualizzare testo nel browser senza includerlo nel file audioutilizzando i tag -AMAZONPOLLY-ONLYWORDS-START- e -AMAZONPOLLY-ONLYWORDS-END- nello stessomodo.

Ad esempio:

Initial text of your blog displayed in the browser and heard in the audio file.] -AMAZONPOLLY-ONLYAUDIO-START- [This part will not be displayed in the browser but will be heard in the audio file.] -AMAZONPOLLY-ONLYAUDIO-END- [Subsequent text of your blog displayed in the browser and heard in the audio file.]

e

[Initial text of your blog displayed in the browser and heard in the audio file.] -AMAZONPOLLY-ONLYWORD-START- This part will be displayed in the browser but will not be heard in the audio file.] -AMAZONPOLLY-ONLYWORD-END- Subsequent text of your blog displayed in the browser and heard in the audio file.

Aggiunta di testo tradotto ai propri postIl plugin AWS per WordPress utilizza Amazon Translate per creare versioni tradotte del proprio post inuna o più lingue. Oltre all'inglese, quattro lingue sono disponibili per questo servizio: spagnolo, francese,tedesco e portoghese. Le lingue da utilizzare e le voci per tali lingue possono essere configurate nellapagina Settings (Impostazioni) nella configurazione Amazon Translate.

Per tradurre il post di WordPress in altre lingue

1. Nella pagina Add New Post (Aggiungi nuovo post), creare e pubblicare il nuovo WordPress post.2. Nella stessa pagina, accertarsi che l'opzione Enable Amazon Polly option (Abilita opzione Amazon

Polly) venga selezionata.3. Per visualizzare il costo approssimativo della creazione di file audio nelle lingue originali oltre ad altre

lingue selezionate, selezionare How much will this cost to convert? (Quanto costa la conversione?)Selezionare OK per tornare alla pagina Add New Post (Aggiungi nuovo post).

4. Selezionare Translate (Traduci)

Per impostare le lingue in cui tradurre il post

1. Nella pagina Settings (Impostazioni), in Amazon Translate configuration (Configurazione AmazonTranslate), selezionare la lingua del post dall'elenco a discesa Source language (Lingua originale).

2. Per Target languages (Lingue di destinazione), selezionare le lingue in cui si desidera tradurre il post.

191

Amazon Polly Developer GuideAmazon Pollycast

3. Dall'elenco a discesa Voice (Voce), selezionare la voce che si desidera utilizzare per ogni linguaselezionata.

4. Inserire un'etichetta per la lingua selezionata.5. Selezionare Save Changes.

Riproduzione di podcast con Amazon PollycastCon i feed di Amazon Pollycast, i visitatori possono ascoltare i tuoi contenuti audio utilizzando applicazionidi podcast standard. I feed Pollycast compatibili con RSS 2.0 forniscono i dati XML necessari perl'aggregazione dei podcast per applicazioni podcast per dispositivi mobili popolari, quali ad esempio iTunes,e directory di podcast.

Quando installi il plugin AWS per WordPress, scegli l'opzione ITunes explicit (Esplicito per ITunes) peraggiungere automaticamente gli endpoint Amazon Pollycast a tutti gli URL dell'archivio di WordPress. Ciòconsente di associare i podcast dell'intero sito o podcast mirati. Se non hai scelto l'opzione ITunes explicit(Esplicito per ITunes) quando hai installato il plugin, procedi nel seguente modo:

1. Nella pagina WordPress Admin (Amministratore WordPress), selezionare Settings (Impostazioni).2. Nella pagina Settings (Impostazioni), scegliere iTunes explicit (Esplicito per ITunes).

Puoi aggiungere manualmente gli endpoint Amazon Pollycast aggiungendo /amazon-pollycast/all'URL di una pagina in un'applicazione di podcast. Ad esempio:

example.com/amazon-pollycast/example.com/category/news/amazon-pollycast/example.com/author/john/amazon-pollcast/

Posizionamento del lettoreQuando installi il plugin AWS per WordPress, per impostazione predefinita questo visualizza un lettoreaudio nella parte superiore del sito Web WordPress, a meno che non scegli di visualizzarlo sotto il testo delsito o di non visualizzarlo affatto.

Puoi riposizionare il lettore, rimuoverlo o aggiungerlo (se scegli di non visualizzarlo) in qualsiasi momento.

Per riposizionare il lettore, rimuoverlo o aggiungerlo al sito Web WordPress

1. Nella pagina WordPress Admin (Amministratore WordPress), selezionare Settings (Impostazioni).2. Nella pagina Amazon Polly Settings (Impostazioni Amazon Polly), per Player position (Posizione

lettore), scegliere l'opzione appropriata.

Per ulteriori informazioni sull'impostazione delle opzioni di configurazione, consulta Configurazione delplugin (p. 189).

192

Amazon Polly Developer GuideArchivio dei file audio

Archiviazione dei file audioQuando pubblichi contenuti sul tuo sito, questi vengono inviati a Amazon Polly per la sintesi. Perimpostazione predefinita, Amazon Polly archivia i nuovi file audio sul tuo server Web. Puoi inoltrearchiviare i file su Amazon Simple Storage Service (Amazon S3) o su Amazon CloudFront, una rete per ladistribuzione di contenuti (CDN, Content Delivery Network) globale.

L'esperienza di ascolto degli utenti non dipende da dove archivi i file audio; cambia solo la zona ditrasmissione:

1. Se archiviati sul server WordPress, i file audio vengono trasmessi direttamente dal server.2. Se archiviati in un bucket S3, i file vengono trasmessi dal bucket.3. Se utilizzi CloudFront, i file vengono archiviati su Amazon S3 e trasmessi con CloudFront.

Puoi scegliere dove archiviare i tuoi file quando installi il plugin Amazon Polly.

193

Amazon Polly Developer GuideRegioni supportate

Quote in Amazon PollyDi seguito sono elencati i limiti da prendere in considerazione quando si utilizza Amazon Polly.

Regioni supportatePer l'elenco delle regioni AWS in cui Amazon Polly è disponibile, consulta l'argomento relativo a endpoint equote di Amazon Polly nella Riferimenti generali di Amazon Web Services.

Le voci neurali sono attualmente supportate nelle seguenti regioni:

• Stati Uniti orientali (Virginia settentrionale): us-east-1• Stati Uniti occidentali (Oregon): us-west-2• UE (Irlanda): eu-west-1• Asia Pacifico (Sydney): ap-southeast-2

Gli endpoint e i protocolli per queste regioni sono identici a quelli utilizzati per le voci standard.

Throttling• Frequenza di throttling per account: 100 transazioni (operazioni o richieste) al secondo (tps) con un limite

di aumento delle prestazioni pari a 120 tps.

Connessioni simultanee per account: 90• Frequenza di throttling per operazione:

Operazione Limite

Lessico

DeleteLexicon

PutLexicon

GetLexicon

ListLexicons

Ogni 2 transazioni al secondo (tps) di queste operazioni combinate.

Il massimo aumento delle prestazioni consentito è pari a 4 tps.

Voce

DescribeVoices 80 tps con un limite di aumento delle prestazioni pari a 100 tps

SynthesizeSpeech Voce standard: 80 tps con un limite di aumento delle prestazionipari a 100 tps

Voce neurale: 8 tps con un limite di aumento delle prestazioni pari a10 tps

194

https://docs.aws.amazon.com/general/latest/gr/pol.html

https://docs.aws.amazon.com/general/latest/gr/pol.html

Amazon Polly Developer GuideLessici di pronuncia

Operazione Limite

StartSpeechSynthesisTask Voce standard: 10 tps con un limite di aumento delle prestazionipari a 12 tps

Voce neurale: 1 tps

GetSynthesizeSpeechTask eListSynthesizeSpeechTask

Il massimo consentito è pari a 10 tps

Lessici di pronuncia• Puoi archiviare fino a 100 lessici per account.• I nomi dei lessici possono essere costituiti da stringhe alfanumeriche con una lunghezza massima di 20

caratteri.• Ogni lessico può avere una dimensione massima di 4000 caratteri. Tieni presente che la dimensione del

lessico influisce sulla latenza dell'operazione SynthesizeSpeech.• In un lessico puoi specificare fino a 100 caratteri per ogni sostituzione di <fonema> o <alias>.

Per informazioni sull'uso dei lessici, consulta Gestione dei lessici (p. 138).

Operazioni SynthesizeSpeech dell'APINota i seguenti limiti correlati all'uso dell'operazione dell'API SynthesizeSpeech:

• Il testo di input può avere una dimensione massima di 3000 caratteri fatturati (6000 caratteri totali). I tagSSML non vengono conteggiati come caratteri fatturati.

• Puoi specificare fino a cinque lessici da applicare al testo di input.• Lo streaming dell'audio di output (sintesi) è limitato a 10 minuti. Una volta raggiunto questo limite,

qualsiasi sintesi vocale rimanente viene interrotta.

Per ulteriori informazioni, consulta SynthesizeSpeech (p. 240).

Note

Alcune limitazioni dell'operazione API SynthesizeSpeech possono essere ignorate utilizzandol'operazione API StartSythensizeSpeechTask. Per ulteriori informazioni, consulta Creazionedi file audio lunghi (p. 149).

Operazioni API SpeechSynthesisTaskNota i seguenti limiti correlati all'uso delle operazioni API StartSpeechSynthesisTask,GetSpeechSynthesisTask e ListSpeechSynthesisTasks:

• Il testo di input può avere una dimensione massima di 100,000 caratteri fatturati (200,000 caratteri totali).I tag SSML non vengono conteggiati come caratteri fatturati.

• Puoi specificare fino a cinque lessici da applicare al testo di input.

195

Amazon Polly Developer GuideSSML (Speech Synthesis Markup Language)

SSML (Speech Synthesis Markup Language)Nota i seguenti limiti correlati all'uso di SSML:

• Non sono supportati i tag <audio>, <lexicon>, <lookup> e <voice>.• Gli elementi <break> possono specificare una durata massima di 10 secondi ciascuno.• Il tag <prosody> non supporta i valori per l'attributo di velocità inferiori a -80%.

Per ulteriori informazioni, consulta Generazione di input vocale da documenti SSML (p. 109).

196

Amazon Polly Developer GuideProtezione dei dati

Sicurezza in Amazon PollyPer AWS, la sicurezza della cloud ha la massima priorità. In quanto cliente AWS, puoi trarre vantaggio daun'architettura di data center e di rete progettata per soddisfare i requisiti delle aziende più esigenti a livellodi sicurezza.

La sicurezza è una responsabilità condivisa tra AWS e l'utente. Il modello di responsabilità condivisadescrive questo come sicurezza del cloud e sicurezza nel cloud:

• Sicurezza del cloud – AWS è responsabile della protezione dell'infrastruttura che esegue i servizi AWSnel cloud AWS. AWS fornisce inoltre i servizi che è possibile utilizzare in modo sicuro. I revisori di terzeparti testano regolarmente e verificano l'efficacia della nostra sicurezza nell'ambito dei Programmi diconformità AWS. Per informazioni sui programmi di compliance applicabili a Amazon Polly, consultaServizi AWS coperti dal programma di compliance.

• Sicurezza nel cloud: la responsabilità dell'utente è determinata dal servizio AWS utilizzato. L'utenteè anche responsabile per altri fattori, tra cui la riservatezza dei dati, i requisiti dell'azienda e leggi enormative applicabili.

Questa documentazione aiuta a comprendere come applicare il modello di responsabilità condivisa quandosi utilizza Amazon Polly. Gli argomenti seguenti illustrano come configurare Amazon Polly per soddisfare gliobiettivi di sicurezza e compliance. Vengono inoltre fornite informazioni su come utilizzare altri servizi AWSche consentono di monitorare e proteggere le risorse Amazon Polly.

Argomenti• Protezione dei dati in Amazon Polly (p. 197)• Identity and Access Management in Amazon Polly (p. 198)• Logging e monitoraggio in Amazon Polly (p. 209)• Convalida della conformità per Amazon Polly (p. 210)• Resilienza in Amazon Polly (p. 210)• Sicurezza dell'infrastruttura in Amazon Polly (p. 210)• Best practice relative alla sicurezza di Amazon Polly (p. 211)

Protezione dei dati in Amazon PollyAmazon Polly è conforme al modello di responsabilità condivisa AWS, il quale comprende regole e lineeguida per la protezione dei dati. AWS è responsabile della protezione dell'infrastruttura globale che eseguetutti i servizi AWS. AWS mantiene il controllo sui dati ospitati su questa infrastruttura, inclusi i controllidi configurazione della sicurezza per la gestione dei contenuti dei clienti e dei dati personali. I clienti ei partner APN AWS, che agiscono come controller dei dati o processori dei dati, sono responsabili diqualsiasi dato personale inserito in AWS Cloud.

Per gli scopi di protezione dei dati, ti consigliamo di proteggere le credenziali dell'account AWS econfigurare singoli account utente con AWS Identity and Access Management (IAM), in modo che aogni utente vengano fornite solo le autorizzazioni necessarie per soddisfare i compiti del processo. Ticonsigliamo inoltre di proteggere i dati nei seguenti modi:

• Utilizza l'autenticazione a più fattori (MFA) con ogni account.• Utilizza SSL/TLS per comunicare con risorse AWS.• Configura la registrazione dell'API e delle attività degli utenti con AWS CloudTrail.• Utilizza le soluzioni di crittografia AWS, insieme a tutti i controlli di sicurezza predefiniti all'interno dei

servizi AWS.

197

http://aws.amazon.com/compliance/shared-responsibility-model/

http://aws.amazon.com/compliance/programs/


http://aws.amazon.com/compliance/services-in-scope/

http://aws.amazon.com/compliance/shared-responsibility-model/

Amazon Polly Developer GuideCrittografia dei dati inattivi

Ti consigliamo di non inserire mai informazioni identificative sensibili, ad esempio i numeri di accountdei clienti, in campi a formato libero, ad esempio un campo Name (Nome). Questo include il lavoro conAmazon Polly o altri servizi AWS utilizzando la console, l'API, l'AWS CLI o gli SDK AWS. Gli eventuali datiimmessi in Amazon Polly o altri servizi potrebbero essere prelevati per l'inserimento nei log di diagnostica.Quando fornisci un URL a un server esterno, non includere informazioni sulle credenziali nell'URL perconvalidare la tua richiesta a tale server.

Per ulteriori informazioni sulla protezione dei dati, consulta il post del blog AWS Modello di responsabilitàcondivisa e GDPR su AWS Security Blog.

Crittografia dei dati inattiviL'output della sintesi vocale Amazon Polly può essere salvato sul tuo sistema. Puoi anche chiamareAmazon Polly, e quindi crittografare il file con qualsiasi chiave di crittografia di tua scelta e archiviarlo inAmazon Simple Storage Service (Amazon S3) o in un altro archivio sicuro. L’operazione Amazon Polly thesection called “SynthesizeSpeech” (p. 240) è stateless e non è associata a un'identità del cliente, Nonpuoi recuperarla successivamente da Amazon Polly.

Crittografia in transitoTutto il testo inviato è protetto da Secure Sockets Layer (SSL) durante il transito. Amazon Polly nonconserva il contenuto del testo inviato.

Riservatezza del traffico InternetL'accesso a Amazon Polly avviene tramite AWS Console, CLI o SDK. Le comunicazioni utilizzanola crittografia delle sessioni TLS (Transport Layer Security) per la riservatezza e le firme digitali perl'autenticazione e l'integrità.

Identity and Access Management in Amazon PollyAWS Identity and Access Management (IAM) è un servizio AWS che consente a un amministratore dicontrollare in modo sicuro l'accesso alle risorse AWS. Gli amministratori IAM controllano chi può essereautenticato (connesso) e autorizzato (dotato di autorizzazioni) a utilizzare risorse Amazon Polly. IAM è unservizio AWS che è possibile utilizzare senza costi aggiuntivi.

Argomenti• Destinatari (p. 198)• Autenticazione con identità (p. 199)• Gestione dell'accesso tramite policy (p. 201)• Funzionamento di Amazon Polly con IAM (p. 202)• Esempi di policy basate su identità Amazon Polly (p. 204)• Autorizzazioni API Amazon Polly: riferimento a operazioni, autorizzazioni e risorse (p. 208)

DestinatariAWS Identity and Access Management (IAM) viene usato in diversi modi, a seconda delle attività svolte inAmazon Polly.

Utente del servizio – Se utilizzi il servizio Amazon Polly per eseguire il tuo lavoro, l'amministratore forniscele credenziali e le autorizzazioni necessarie. All'aumentare del numero di funzionalità Amazon Polly

198

http://aws.amazon.com/blogs/security/the-aws-shared-responsibility-model-and-gdpr/

http://aws.amazon.com/blogs/security/the-aws-shared-responsibility-model-and-gdpr/

https://docs.aws.amazon.com/general/latest/gr/signing_aws_api_requests.html

Amazon Polly Developer GuideAutenticazione con identità

utilizzate per il lavoro, potrebbero essere necessarie ulteriori autorizzazioni. La comprensione dellagestione dell'accesso aiuta a richiedere le autorizzazioni corrette all'amministratore.

Amministratore del servizio – Se sei il responsabile delle risorse Amazon Polly presso la tua azienda,probabilmente disponi dell'accesso completo a Amazon Polly. Il tuo compito è determinare lecaratteristiche e le risorse Amazon Polly a cui i dipendenti devono accedere. Devi quindi inviare richiesteall'amministratore IAM per la modifica delle autorizzazioni degli utenti del servizio. Esamina le informazionicontenute in questa pagina per comprendere i concetti di base relativi a IAM. Per ulteriori informazioni sucome la tua azienda può utilizzare IAM con Amazon Polly, consulta Funzionamento di Amazon Polly conIAM (p. 202).

Amministratore IAM – Se sei un amministratore IAM, potresti essere interessato a ricevere informazionisu come scrivere policy per gestire l'accesso a Amazon Polly. Per visualizzare policy basate su identitàAmazon Polly di esempio che puoi utilizzare in IAM, consulta Esempi di policy basate su identità AmazonPolly (p. 204).

Autenticazione con identitàL'autenticazione è la procedura di accesso ad AWS utilizzando le credenziali di identità. Per ulterioriinformazioni sull'accesso utilizzando la Console di gestione AWS,consulta La console IAM e la pagina diaccesso nella Guida per l'utente di IAM.

È necessario essere autenticati (connessi ad AWS) come Utente root dell'account AWS, un utente IAM omediante l'assunzione del ruolo IAM. È anche possibile utilizzare l’autenticazione Single Sign-On (SSO)della propria azienda oppure collegarsi utilizzando Google o Facebook. In questi casi, l’amministratore haconfigurato in precedenza la federazione delle identità utilizzando i ruoli IAM. Quando si accede ad AWSutilizzando le credenziali di un’altra azienda, si assume indirettamente un ruolo.

Per accedere direttamente alla Console di gestione AWS, utilizza la tua password con l’e-mail utente rooto il nome utente IAM. Puoi effettuare l'accesso ad AWS a livello di programmazione utilizzando le chiavidi accesso utente root o IAM. AWS fornisce SDK e strumenti a riga di comando per firmare in manieracrittografica la richiesta utilizzando le tue credenziali. Se non utilizzi gli strumenti di AWS, devi firmare larichiesta personalmente. A questo scopo, utilizza Signature Version 4, un protocollo per l'autenticazione dirichieste API in entrata. Per ulteriori informazioni sulle richieste di autenticazione, consulta la pagina relativaal processo di firma Signature Version 4 nella AWS General Reference.

Indipendentemente dal metodo di autenticazione utilizzato, potrebbe essere necessario specificare ulterioriinformazioni sulla sicurezza. AWS consiglia ad esempio di utilizzare l'autenticazione a più fattori (MFA) peraumentare la sicurezza del tuo account. Per ulteriori informazioni, consulta Utilizzo dell'autenticazione a piùfattori (MFA) in AWS nella Guida per l'utente di IAM.

Utente root dell'account AWSQuando crei un account AWS per la prima volta, inizi con una singola identità di accesso che ha accessocompleto a tutti i servizi e le risorse AWS nell'account. Tale identità è chiamata account dell'account AWSutente root e puoi accedervi con l'indirizzo e-mail e la password utilizzati per creare l'account. È vivamenteconsigliato di non utilizzare utente root per le attività quotidiane, anche quelle amministrative. Attieniti allabest practice per utilizzare la utente root soltanto per creare il tuo primo utente IAM. Quindi conserva alsicuro le credenziali utente root e utilizzale per eseguire solo alcune attività di gestione dell'account e delservizio.

Utenti e gruppi IAMUn utente IAM è un'identità all'interno dell'account AWS che dispone di autorizzazioni specifiche per unsingolo utente o applicazione. Un utente IAM può disporre di credenziali a lungo termine, ad esempio unnome utente e una password oppure un set di chiavi di accesso. Per informazioni su come generare lechiavi di accesso, consulta Gestione delle chiavi di accesso per gli utenti IAM nella Guida per l'utente di

199

https://docs.aws.amazon.com/IAM/latest/UserGuide/console.html

https://docs.aws.amazon.com/IAM/latest/UserGuide/console.html

https://console.aws.amazon.com/

https://docs.aws.amazon.com/general/latest/gr/signature-version-4.html

https://docs.aws.amazon.com/IAM/latest/UserGuide/id_credentials_mfa.html


https://docs.aws.amazon.com/IAM/latest/UserGuide/best-practices.html#create-iam-users

https://docs.aws.amazon.com/IAM/latest/UserGuide/id_users.html

https://docs.aws.amazon.com/IAM/latest/UserGuide/id_credentials_access-keys.html

Amazon Polly Developer GuideAutenticazione con identità

IAM. Quando generi le chiavi di accesso per un utente IAM, assicurarti di visualizzare e salvare la coppiadi chiavi in modo sicuro. Non puoi recuperare la chiave di accesso segreta in futuro. Al contrario, sarànecessario generare una nuova coppia di chiavi di accesso.

Un gruppo IAM è un’identità che specifica una raccolta di utenti IAM. Non è possibile eseguire l’accessocome gruppo. Puoi utilizzare gruppi per specificare le autorizzazioni per più utenti alla volta. I gruppisemplificano la gestione delle autorizzazioni per set di utenti di grandi dimensioni. Ad esempio, puoi avereun gruppo denominato Amministratori IAM e concedere a tale gruppo le autorizzazioni per amministrare lerisorse IAM.

Gli utenti sono diversi dai ruoli. Un utente è associato in modo univoco a una persona o un'applicazione,mentre un ruolo è destinato a essere assunto da chiunque ne abbia bisogno. Gli utenti dispongono dicredenziali a lungo termine permanenti, mentre i ruoli forniscono credenziali temporanee. Per ulterioriinformazioni, consulta Quando creare un utente IAM invece di un ruolo nella Guida per l'utente di IAM.

Ruoli IAMUn ruolo IAM è un'identità all'interno dell'account AWS che dispone di autorizzazioni specifiche. È similea un utente IAM ma non è associato a una persona specifica. È possibile assumere temporaneamente unruolo IAM nella Console di gestione AWS mediante lo scambio di ruoli. Puoi assumere un ruolo chiamandoun'operazione AWS CLI o API AWS oppure utilizzando un URL personalizzato. Per ulteriori informazioni suimetodi per l'utilizzo di ruoli, consulta Utilizzo di ruoli IAM nella Guida per l'utente di IAM.

I ruoli IAM con credenziali temporanee sono utili nelle seguenti situazioni:

• Autorizzazioni utente IAM temporanee– Un utente IAM può assumere un ruolo IAM per otteneretemporaneamente autorizzazioni diverse per un'attività specifica.

• Accesso utente federato – Invece di creare un utente IAM, puoi utilizzare identità esistenti da AWSDirectory Service, dalla tua directory di utente aziendale o da un provider di identità Web. Sono noticome utenti federati. AWS assegna un ruolo a un utente federato quando è richiesto l'accesso tramiteun provider di identità. Per ulteriori informazioni sugli utenti federati, consulta la pagina relativa a utentifederati e ruoli nella Guida per l'utente di IAM.

• Accesso tra account – Puoi utilizzare un ruolo IAM per permettere a un utente (principale attendibile)con un account diverso di accedere alle risorse nel tuo account. I ruoli sono lo strumento principaleper concedere l'accesso tra account. Tuttavia, con alcuni dei servizi AWS, puoi collegare una policydirettamente a una risorsa (anziché utilizzare un ruolo come un proxy). Per informazioni sulle differenzetra ruoli e policy basate su risorse per l'accesso tra account, consulta Differenza tra i ruoli IAM e le policybasate su risorse nella Guida per l'utente di IAM.

• Accesso al servizio AWS –Un ruolo di servizio è un ruolo IAM che un servizio assume per eseguireoperazioni nel tuo account a tuo nome. Quando configuri gli ambienti di servizio AWS, devi definireun ruolo che il servizio deve assumere. Questo ruolo di servizio deve includere tutte le autorizzazioninecessarie per accedere alle risorse AWS di cui ha bisogno. I ruoli del servizio variano da servizioa servizio, ma molti permettono di selezionare le autorizzazioni, a condizione di soddisfare i requisitidocumentati per quel servizio. I ruoli del servizio forniscono l'accesso all'interno del tuo account e nonpossono essere utilizzati per concedere l'accesso ai servizi in altri account. Puoi creare, modificare edeliminare un ruolo del servizio dall'interno di IAM. Ad esempio, puoi creare un ruolo che consente aAmazon Redshift di accedere a un bucket Amazon S3 per tuo conto e quindi caricare i dati dal bucketin un cluster Amazon Redshift. Per ulteriori informazioni, consulta Creazione di un ruolo per delegare leautorizzazioni a un servizio AWS nella Guida per l'utente di IAM.

• Applicazioni in esecuzione su Amazon EC2 –Puoi utilizzare un ruolo IAM per gestire credenzialitemporanee per le applicazioni in esecuzione su un'istanza EC2 e inviare richieste AWS CLI o APIAWS. Ciò è preferibile all'archiviazione delle chiavi di accesso nell'istanza EC2. Per assegnare un ruoloAWS a un'istanza EC2, affinché sia disponibile per tutte le relative applicazioni, puoi creare un profilo diistanza collegato all'istanza. Un profilo di istanza contiene il ruolo e consente ai programmi in esecuzionesull'istanza EC2 di ottenere le credenziali temporanee. Per ulteriori informazioni, consulta Utilizzo diun ruolo IAM per concedere autorizzazioni ad applicazioni in esecuzione su istanze Amazon EC2 nellaGuida per l'utente di IAM.

200

https://docs.aws.amazon.com/IAM/latest/UserGuide/id_groups.html

https://docs.aws.amazon.com/IAM/latest/UserGuide/id.html#id_which-to-choose

https://docs.aws.amazon.com/IAM/latest/UserGuide/id_roles.html

https://docs.aws.amazon.com/IAM/latest/UserGuide/id_roles_use_switch-role-console.html

https://docs.aws.amazon.com/IAM/latest/UserGuide/id_roles_use.html

https://docs.aws.amazon.com/IAM/latest/UserGuide/id_roles_providers.html

https://docs.aws.amazon.com/IAM/latest/UserGuide/introduction_access-management.html#intro-access-roles

https://docs.aws.amazon.com/IAM/latest/UserGuide/introduction_access-management.html#intro-access-roles

https://docs.aws.amazon.com/IAM/latest/UserGuide/id_roles_compare-resource-policies.html

https://docs.aws.amazon.com/IAM/latest/UserGuide/id_roles_compare-resource-policies.html

https://docs.aws.amazon.com/IAM/latest/UserGuide/id_roles_create_for-service.html

https://docs.aws.amazon.com/IAM/latest/UserGuide/id_roles_create_for-service.html

https://docs.aws.amazon.com/IAM/latest/UserGuide/id_roles_use_switch-role-ec2.html

https://docs.aws.amazon.com/IAM/latest/UserGuide/id_roles_use_switch-role-ec2.html

Amazon Polly Developer GuideGestione dell'accesso tramite policy

Per informazioni sull'utilizzo di ruoli IAM, consulta Quando creare un ruolo IAM invece di un utente nellaGuida per l'utente di IAM.

Gestione dell'accesso tramite policyPer controllare l'accesso ad AWS è possibile creare policy e collegarle a identità IAM o risorse AWS.Una policy è un oggetto in AWS che, quando viene associato a un'identità o a una risorsa, ne definisce leautorizzazioni. AWS valuta queste policy quando un'entità (utente root, utente IAM o ruolo IAM) effettuauna richiesta. Le autorizzazioni nella policy determinano l'approvazione o il rifiuto della richiesta. Lamaggior parte delle policy viene memorizzata in AWS sotto forma di documenti JSON. Per ulterioriinformazioni sulla struttura e sui contenuti dei documenti delle policy JSON, consulta Panoramica dellepolicy JSON nella Guida per l'utente di IAM.

Un amministratore IAM può utilizzare le policy per specificare quali utenti hanno accesso alle risorseAWS e quali operazioni possono eseguire su tali risorse. Ogni entità IAM (utente o ruolo) inizialmente nondispone di autorizzazioni. Ovvero, per impostazione predefinita, gli utenti non possono eseguire alcunaoperazione, neppure modificare la propria password. Per autorizzare un utente a eseguire operazioni, unamministratore deve collegare una policy di autorizzazioni a tale utente. In alternativa, l'amministratore puòaggiungere l'utente a un gruppo che dispone delle autorizzazioni desiderate. Quando un amministratorefornisce le autorizzazioni a un gruppo, le autorizzazioni vengono concesse a tutti gli utenti in tale gruppo.

Le policy IAM definiscono le autorizzazioni relative a un'operazione, indipendentemente dal metodoutilizzato per eseguirla. Ad esempio, supponiamo di disporre di una policy che consente l'operazioneiam:GetRole. Un utente con tale policy può ottenere informazioni sul ruolo dalla Console di gestioneAWS, la AWS CLI o l’API AWS.

Policy basate sulle identitàLe policy basate su identità sono documenti di policy di autorizzazione JSON che è possibile collegarea un'identità, ad esempio un utente, un ruolo o un gruppo IAM. Tali policy definiscono le operazioniautorizzate per l'identità, nonché le risorse e le condizioni in cui possono essere eseguite. Per informazionisu come creare una policy basata su identità, consulta Creazione di policy IAM nella Guida per l'utente diIAM.

Le policy basate su identità possono essere ulteriormente classificate come policy inline o policy gestite.Le policy inline sono incorporate direttamente in un singolo utente, gruppo o ruolo. Le policy gestite sonopolicy standalone che possono essere collegate a più utenti, gruppi e ruoli nell'account AWS. Le policygestite includono le policy gestite da AWS e le policy gestite dal cliente. Per informazioni su come sceglieretra una policy gestita o una policy inline, consulta Scelta fra policy gestite e policy inline nella Guida perl'utente di IAM.

Policy basate su risorseAnche altri servizi, come Amazon S3, supportano policy di autorizzazioni basate su risorse. Ad esempio,puoi collegare una policy a un bucket S3 per gestire le autorizzazioni di accesso al bucket. Amazon Pollynon supporta policy basate su risorse.

Altri tipi di policyAWS supporta tipi di policy meno comuni aggiuntivi. Questi tipi di policy possono impostare il numeromassimo di autorizzazioni concesse dai tipi di policy più comuni.

• Limiti delle autorizzazioni – Un limite delle autorizzazioni è una funzione avanzata nella quale si impostail numero massimo di autorizzazioni che una policy basata su identità può concedere a un'entità IAM(utente o ruolo IAM). È possibile impostare un limite delle autorizzazioni per un'entità. Le autorizzazionirisultanti sono l’intersezione delle policy basate su identità dell’entità e i suoi limiti delle autorizzazioni. Le

201

https://docs.aws.amazon.com/IAM/latest/UserGuide/id.html#id_which-to-choose_role

https://docs.aws.amazon.com/IAM/latest/UserGuide/access_policies.html#access_policies-json

https://docs.aws.amazon.com/IAM/latest/UserGuide/access_policies.html#access_policies-json

https://docs.aws.amazon.com/IAM/latest/UserGuide/access_policies_create.html

https://docs.aws.amazon.com/IAM/latest/UserGuide/access_policies_managed-vs-inline.html#choosing-managed-or-inline

Amazon Polly Developer GuideFunzionamento di Amazon Polly con IAM

policy basate su risorse che specificano l'utente o il ruolo nel campo Principal sono limitate dal limitedelle autorizzazioni. Un rifiuto esplicito in una qualsiasi di queste policy sostituisce l'autorizzazione. Perulteriori informazioni sui limiti delle autorizzazioni, consulta Limiti delle autorizzazioni per le entità IAMnella Guida per l'utente di IAM.

• Policy di controllo dei servizi (SCP)– Le SCP sono policy JSON che specificano il numero massimodi autorizzazioni per un'organizzazione o unità organizzativa (OU) in AWS Organizations. AWSOrganizations è un servizio per il raggruppamento e la gestione centralizzata degli account AWS multiplidi proprietà dell'azienda. Se si abilitano tutte le caratteristiche in un'organizzazione, è possibile applicarele policy di controllo dei servizi (SCP) a uno o tutti i propri account. L'SCP limita le autorizzazioni perle entità negli account membri, compreso ogni Utente root dell'account AWS. Per ulteriori informazionisu Organizations e SCP, consultare Come funzionano le SCP nella Guida per l'utente di AWSOrganizations.

• Policy di sessione – Le policy di sessione sono policy avanzate che si passano come parametroquando si crea in modo programmatico una sessione temporanea per un ruolo o un utente federato.Le autorizzazioni della sessione risultante sono l’intersezione delle policy basate sull’identità del ruoloo dell’utente e le policy di sessione. Le autorizzazioni possono anche provenire da una policy basatasu risorse. Un rifiuto esplicito in una qualsiasi di queste policy sostituisce l'autorizzazione. Per ulterioriinformazioni, consulta Policy di sessione nella Guida per l'utente di IAM.

Più tipi di policyQuando più tipi di policy si applicano a una richiesta, le autorizzazioni risultanti sono più complicate dacomprendere. Per informazioni su come AWS determina se consentire una richiesta quando sono coinvoltipiù tipi di policy, consulta Logica di valutazione delle policy nella Guida per l'utente di IAM.

Funzionamento di Amazon Polly con IAMPrima di utilizzare IAM per gestire l'accesso ad Amazon Polly, è necessario comprendere qualicaratteristiche di IAM sono disponibili con Amazon Polly. Per ottenere una vista generale delfunzionamento di Amazon Polly e di altri servizi AWS con IAM, consulta Servizi AWS supportati da IAMnella Guida per l'utente di IAM.

Argomenti• Policy basate su identità Amazon Polly (p. 202)• Ruoli Amazon PollyIAM (p. 203)

Policy basate su identità Amazon PollyCon le policy basate su identità IAM, puoi specificare operazioni e risorse consentite o rifiutate, nonché lecondizioni in base alle quali le operazioni sono consentite o rifiutate. Amazon Polly supporta operazioni,risorse e chiavi di condizione specifiche. Per informazioni su tutti gli elementi utilizzati in una policy JSON,consulta Documentazione di riferimento degli elementi delle policy JSON IAM nella Guida per l'utente diIAM.

OperazioniL'elemento Action di una policy basata su identità IAM descrive l'operazione o le operazioni specificheche saranno concesse o rifiutate dalla policy. Le operazioni della policy hanno spesso lo stesso nomedell’operazione API AWS. L’operazione viene utilizzata in una policy per concedere le autorizzazioni dieseguire l’operazione associata.

Le operazioni delle policy in Amazon Polly utilizzano il seguente prefisso prima dell'operazione: polly:.Ad esempio, per concedere a qualcuno l'autorizzazione per eliminare un lexicon Amazon Polly conl'operazione API Amazon Polly DeleteLexicon, includi l'operazione polly:DeletedLexicon nella

202

https://docs.aws.amazon.com/IAM/latest/UserGuide/access_policies_boundaries.html

https://docs.aws.amazon.com/organizations/latest/userguide/orgs_manage_policies_about-scps.html

https://docs.aws.amazon.com/IAM/latest/UserGuide/access_policies.html#policies_session

https://docs.aws.amazon.com/IAM/latest/UserGuide/reference_policies_evaluation-logic.html

https://docs.aws.amazon.com/IAM/latest/UserGuide/reference_aws-services-that-work-with-iam.html

https://docs.aws.amazon.com/IAM/latest/UserGuide/reference_policies_elements.html

Amazon Polly Developer GuideFunzionamento di Amazon Polly con IAM

policy. Le istruzioni delle policy devono includere un elemento Action o NotAction. Amazon Pollydefinisce un proprio set di operazioni che descrive le attività che puoi eseguire con questo servizio.

Per specificare più operazioni in una sola dichiarazione, separa ciascuna di esse con una virgola comemostrato di seguito:

"Action": [ "polly:action1", "polly:action2"]

Puoi specificare più operazioni tramite caratteri jolly (*). Ad esempio, per specificare tutte le operazioni cheiniziano con la parola Get, includere la seguente operazione:

"Action": "polly:Get*"

Per visualizzare l'elenco delle operazioni Amazon Polly, consulta Actions Defined by Amazon Polly nellaGuida per l'utente di IAM.

RisorseAmazon Polly non supporta la specifica degli ARN delle risorse in una policy.

Chiavi di condizioneAmazon Polly non fornisce chiavi di condizione specifiche del servizio, ma supporta l'utilizzo di alcunechiavi di condizione globali. Per visualizzare tutte le chiavi di condizione globali AWS, consulta Chiavi dicontesto delle condizioni globali AWS nella Guida per l'utente di IAM.

EsempiPer visualizzare esempi di policy basate su identità Amazon Polly, consulta Esempi di policy basate suidentità Amazon Polly (p. 204).

Ruoli Amazon PollyIAMPer concedere autorizzazioni multiaccount, puoi collegare una policy di autorizzazione basata su identità aun ruolo IAM. Ad esempio, l'amministratore dell'account A può creare un ruolo per concedere autorizzazionimulti-account a un altro account AWS (ad esempio l'account B) oppure a un servizio AWS nel modoseguente:

1. L'amministratore dell'account A crea un ruolo IAM e collega una policy di autorizzazioni al ruolo checoncede le autorizzazioni per le risorse nell'account A.

2. L'amministratore dell'account A collega una policy di attendibilità al ruolo, identificando l'account B comeprincipale per tale ruolo.

3. L'amministratore dell'account B può quindi delegare le autorizzazioni per usare tale ruolo a qualsiasiutente nell'account B. In questo modo, gli utenti nell'account B possono creare risorse nell'account Ao accedervi. Se si desidera concedere a un servizio AWS le autorizzazioni per usare il ruolo, l'entitàprincipale nella policy di trust può essere anche un'entità principale del servizio AWS.

Per ulteriori informazioni sull'uso di IAM per delegare le autorizzazioni, consulta Gestione degli accessinella Guida per l'utente di IAM.

Di seguito è riportata una policy di esempio che concede autorizzazioni per inserire e ricevere lessici,nonché per elencare i lessici attualmente disponibili.

Amazon Polly supporta le policy basate su identità per le operazioni a livello di risorsa. In alcuni casi,la risorsa può essere limitata da un ARN. Questo è vero per le operazioni SynthesizeSpeech,

203

https://docs.aws.amazon.com/IAM/latest/UserGuide/list_awskeymanagementservice.html#awskeymanagementservice-actions-as-permissions

https://docs.aws.amazon.com/IAM/latest/UserGuide/reference_policies_condition-keys.html

https://docs.aws.amazon.com/IAM/latest/UserGuide/reference_policies_condition-keys.html

https://docs.aws.amazon.com/IAM/latest/UserGuide/access.html

Amazon Polly Developer GuideEsempi di policy basate su identità

StartSpeechSynthesisTask, PutLexicon, GetLexicon e DeleteLexicon. In questi casi, il valoreResource è indicato dall'ARN. L'elemento arn:aws:polly:us-east-2:account-id:lexicon/*come valore Resource specifica ad esempio autorizzazioni su tutti i lessici di proprietà nella regione us-east-2.

{ "Version": "2012-10-17", "Statement": [{ "Sid": "AllowPut-Get-ListActions", "Effect": "Allow", "Action": [ "polly:PutLexicon", "polly:GetLexicon", "polly:ListLexicons"], "Resource": "arn:aws:polly:us-east-2:account-id:lexicon/*" } ]}

However, not all operations use ARNs. This is the case with the DescribeVoices, ListLexicons,GetSpeechSynthesisTasks, and ListSpeechSynthesisTasks operations.

Per ulteriori informazioni su utenti, gruppi, ruoli e autorizzazioni, consulta la pagina relativa alle identità(utenti, gruppi e ruoli) nella Guida per l'utente di IAM.

Esempi di policy basate su identità Amazon PollyPer impostazione predefinita, gli utenti e i ruoli IAM non dispongono dell'autorizzazione per creare omodificare le risorse Amazon Polly. Inoltre, non sono in grado di eseguire attività utilizzando la Console digestione AWS, AWS CLI o un'API AWS. Un amministratore IAM deve creare policy IAM che concedono autenti e ruoli l'autorizzazione per eseguire operazioni API specifiche sulle risorse specificate di cui hannobisogno. L'amministratore devi quindi collegare queste policy a utenti o gruppi IAM che richiedono taliautorizzazioni.

Per informazioni su come creare una policy basata su identità IAM utilizzando questi documenti di policyJSON di esempio, consulta Creazione di policy nella scheda JSON nella Guida per l'utente di IAM.

Argomenti• Best practice delle policy (p. 204)• Utilizzo della console Amazon Polly (p. 205)• Consentire agli utenti di visualizzare le loro autorizzazioni (p. 205)• Policy (predefinite) gestite da AWS per Amazon Polly (p. 206)• Esempi di policy gestite dal cliente (p. 206)

Best practice delle policyLe policy basate su identità sono molto potenti. Determinano se qualcuno può creare, accedere o eliminarerisorse Amazon Polly nell'account. Queste operazioni possono comportare costi aggiuntivi per l'accountAWS. Quando crei o modifichi policy basate su identità, segui queste linee guida e raccomandazioni:

• Nozioni di base sull'utilizzo di policy gestite AWS: per iniziare a utilizzare rapidamente Amazon Polly,utilizza policy gestite AWS per fornire ai dipendenti le autorizzazioni richieste. Queste policy sono giàdisponibili nel tuo account e sono gestite e aggiornate da AWS. Per ulteriori informazioni, consultaNozioni di base sull'utilizzo delle autorizzazioni con le policy gestite da AWS nella Guida per l'utente diIAM.

204

https://docs.aws.amazon.com/IAM/latest/UserGuide/id.html

https://docs.aws.amazon.com/IAM/latest/UserGuide/id.html

https://docs.aws.amazon.com/IAM/latest/UserGuide/access_policies_create.html#access_policies_create-json-editor

https://docs.aws.amazon.com/IAM/latest/UserGuide/best-practices.html#bp-use-aws-defined-policies


• Assegnare il privilegio minimo: quando si creano policy personalizzate, concedere solo le autorizzazionirichieste per eseguire un'attività. Iniziare con un set di autorizzazioni minimo e concedere autorizzazioniaggiuntive quando necessario. In questo modo, è più sicuro che iniziare con autorizzazioni che sonotroppo permissive e cercare di limitarle in un secondo momento. Per ulteriori informazioni, consultaAssegnare il privilegio minimo nella Guida per l'utente di IAM.

• Abilitare MFA per operazioni sensibili– Per una maggiore sicurezza, richiedere agli utenti IAM di utilizzarel'autenticazione a più fattori (MFA) per accedere a risorse sensibili o operazioni API. Per ulterioriinformazioni, consulta Utilizzo dell'autenticazione a più fattori (MFA) in AWS nella Guida per l'utente diIAM.

• Utilizzare le condizioni della policy per ulteriore sicurezza – Per quanto possibile, definire le condizioniin cui le policy basate su identità consentono l'accesso a una risorsa. Ad esempio, è possibile scriverecondizioni per specificare un intervallo di indirizzi IP consentiti dai quali deve provenire una richiesta. Èanche possibile scrivere condizioni per consentire solo le richieste all'interno di un intervallo di date oore specificato oppure per richiedere l'utilizzo di SSL o MFA. Per ulteriori informazioni, consulta Elementidelle policy JSON IAM: Condition nella Guida per l'utente di IAM.

Utilizzo della console Amazon PollyPer utilizzare la console Amazon Polly, un utente deve disporre di un set minimo di autorizzazioni perdescrivere le risorse Amazon Polly nell'account AWS.

Se si crea una policy IAM più restrittiva delle autorizzazioni minime richieste, la console non funzionerà nelmodo previsto per gli utenti con tale policy IAM.

Non sono necessarie le autorizzazioni minime della console per gli utenti che effettuano chiamate soloall'API di AWS CLI o di Amazon Polly.

Per utilizzare la console Amazon Polly, occorre concedere autorizzazioni a tutte le API Amazon Polly. Nonsono necessarie autorizzazioni aggiuntive Per ottenere la funzionalità completa della console, è possibileutilizzare le seguenti policy:.

} "Version": "2012-10-17", "Statement": [{ "Sid": "Console-AllowAllPollyActions", "Effect": "Allow", "Action": [ "polly:*"], "Resource": "*" } ]}

Consentire agli utenti di visualizzare le loro autorizzazioniQuesto esempio mostra in che modo è possibile creare una policy che consente agli utenti IAM divisualizzare le policy inline e gestite che sono collegate alla relativa identità utente. Questa policy include leautorizzazioni per completare questa operazione sulla console o a livello di codice utilizzando AWS CLI ol'API AWS.

{ "Version": "2012-10-17", "Statement": [ { "Sid": "ViewOwnUserInfo", "Effect": "Allow", "Action": [ "iam:GetUserPolicy",

205

https://docs.aws.amazon.com/IAM/latest/UserGuide/best-practices.html#grant-least-privilege


https://docs.aws.amazon.com/IAM/latest/UserGuide/reference_policies_elements_condition.html

https://docs.aws.amazon.com/IAM/latest/UserGuide/reference_policies_elements_condition.html


"iam:ListGroupsForUser", "iam:ListAttachedUserPolicies", "iam:ListUserPolicies", "iam:GetUser" ], "Resource": ["arn:aws:iam::*:user/${aws:username}"] }, { "Sid": "NavigateInConsole", "Effect": "Allow", "Action": [ "iam:GetGroupPolicy", "iam:GetPolicyVersion", "iam:GetPolicy", "iam:ListAttachedGroupPolicies", "iam:ListGroupPolicies", "iam:ListPolicyVersions", "iam:ListPolicies", "iam:ListUsers" ], "Resource": "*" } ]}

Policy (predefinite) gestite da AWS per Amazon PollyAWS gestisce molti casi di utilizzo comune con policy IAM autonome create e amministrate da AWS. Lepolicy gestite da AWS concedono le autorizzazioni necessarie per i casi di utilizzo comune in modo da nondover cercare quali sono le autorizzazioni richieste. Per ulteriori dettagli, consulta Policy gestite AWS nellaGuida per l'utente di IAM.

Le policy gestite AWS seguenti, che puoi collegare a utenti nell'account, sono specifiche di Amazon Polly:

• AmazonPollyReadOnlyAccess – Concede l'accesso in sola lettura alle risorse, di elencare e recuperarelessici e di elencare voci e sintesi vocali (ad esempio applicando lessici alla sintesi vocale).

• AmazonPollyFullAccess – - Concede l'accesso completo a risorse e a tutte le operazioni supportate.

Note

Per esaminare queste policy di autorizzazione, accedi alla console IAM ed esegui la ricerca dellepolicy specifiche.

Puoi anche creare policy IAM personalizzate allo scopo di concedere autorizzazioni per operazioni e risorseAmazon Polly. Puoi collegare queste policy personalizzate agli utenti o ai gruppi IAM che richiedono leautorizzazioni.

Esempi di policy gestite dal clienteQuesta sezione include policy utente di esempio che concedono autorizzazioni per diverse operazioniAmazon Polly. Tali policy funzionano quando utilizzi gli SDK AWS oppure la AWS CLI. Quando si utilizza laconsole, occorre concedere autorizzazioni a tutte le API Amazon Polly.

Note

Tutti gli esempi utilizzano la regione us-east-2 e contengono ID account fittizi.

Esempi• Esempio 1: consentire tutte le operazioni Amazon Polly (p. 207)• Esempio 2: consentire tutte le operazioni Amazon Polly ad eccezione di DeleteLexicon (p. 207)

206

https://docs.aws.amazon.com/IAM/latest/UserGuide/access_policies_managed-vs-inline.html#aws-managed-policies


• Esempio 3: consentire DeleteLexicon (p. 207)• Esempio 4: consentire DeleteLexicon in una regione specifica (p. 208)• Esempio 5: consentire DeleteLexicon per un lessico specifico (p. 208)

Esempio 1: consentire tutte le operazioni Amazon PollyDopo aver effettuato l'accesso (consultare Fase 1.1: registrazione ad AWS (p. 4)), è necessario creare unutente amministratore per gestire l'account, ad esempio per creare utenti e gestirne le autorizzazioni.

È possibile creare un utente che dispone delle autorizzazioni per tutte le operazioni Amazon Polly.Considerare questo utente come un amministratore specifico del servizio per l’utilizzo con Amazon Polly. Èpossibile collegare la policy di autorizzazione seguente a tale utente.

{ "Version": "2012-10-17", "Statement": [{ "Sid": "AllowAllPollyActions", "Effect": "Allow", "Action": [ "polly:*"], "Resource": "*" } ]}

Esempio 2: consentire tutte le operazioni Amazon Polly ad eccezione diDeleteLexiconLa policy di autorizzazione seguente concede le autorizzazioni utente per eseguire tutte le operazioni adeccezione di DeleteLexicon, con le autorizzazioni per l'eliminazione negate esplicitamente in tutte leregioni.

{ "Version": "2012-10-17", "Statement": [{ "Sid": "AllowAllActions-DenyDelete", "Effect": "Allow", "Action": [ "polly:DescribeVoices", "polly:GetLexicon", "polly:PutLexicon", "polly:SynthesizeSpeech", "polly:ListLexicons"], "Resource": "*" } { "Sid": "DenyDeleteLexicon", "Effect": "Deny", "Action": [ "polly:DeleteLexicon"], "Resource": "*" } ]}

Esempio 3: consentire DeleteLexiconLa policy di autorizzazione seguente concede le autorizzazioni utente per eliminare qualsiasi lessico diproprietà indipendentemente dal progetto o dalla regione in cui si trova.

207

Amazon Polly Developer GuideRiferimento alle autorizzazioni API Amazon Polly

{ "Version": "2012-10-17", "Statement": [{ "Sid": "AllowDeleteLexicon", "Effect": "Allow", "Action": [ "polly:DeleteLexicon"], "Resource": "*" } ]}

Esempio 4: consentire DeleteLexicon in una regione specificaLa policy di autorizzazione seguente concede le autorizzazioni utente per eliminare qualsiasi lessico in tuttii progetti che si trovano in una regione specifica (in questo caso, us-east-2).

{ "Version": "2012-10-17", "Statement": [{ "Sid": "AllowDeleteSpecifiedRegion", "Effect": "Allow", "Action": [ "polly:DeleteLexicon"], "Resource": "arn:aws:polly:us-east-2:123456789012:lexicon/*" } ]}

Esempio 5: consentire DeleteLexicon per un lessico specificoLa policy di autorizzazione seguente concede le autorizzazioni utente per eliminare un lessico specifico diproprietà (in questo caso, myLexicon) in una regione specifica (in questo caso, us-east-2).

{ "Version": "2012-10-17", "Statement": [{ "Sid": "AllowDeleteForSpecifiedLexicon", "Effect": "Allow", "Action": [ "polly:DeleteLexicon"], "Resource": "arn:aws:polly:us-east-2:123456789012:lexicon/myLexicon" } ]}

Autorizzazioni API Amazon Polly: riferimento aoperazioni, autorizzazioni e risorseQuando configuri e scrivi una policy di autorizzazione che puoi collegare a un'identità IAM (policy basatesu identità), puoi utilizzare l'elenco nella seguente come riferimento. L'elenco include ogni operazione APIdi Amazon Polly, le operazioni corrispondenti per le quali puoi concedere autorizzazioni di esecuzione ela risorsa AWS per la quale puoi concedere le autorizzazioni. Puoi specificare le operazioni nel campoAction della policy e il valore della risorsa nel campo Resource.

Per esprimere le condizioni, puoi usare le chiavi di condizione a livello di AWS nelle policy Amazon Polly.Per un elenco completo di chiavi AWS, consulta la pagina relativa alle chiavi disponibili nella Guida perl'utente di IAM.

208

https://docs.aws.amazon.com/IAM/latest/UserGuide/reference_policies_elements.html#AvailableKeys

Amazon Polly Developer GuideLogging e monitoraggio

Note

Per specificare un'operazione, utilizza il prefisso polly seguito dal nome dell'operazione API (adesempio, polly:GetLexicon).

Amazon Polly supporta le policy basate su identità per le operazioni a livello di risorsa. Di conseguenza,il valore Resource è indicato dall'ARN. L'elemento arn:aws:polly:us-east-2:account-id:lexicon/* come valore Resource specifica ad esempio autorizzazioni su tutti i lessici di proprietànella regione us-east-2.

Poiché Amazon Polly non supporta le autorizzazioni per operazioni a livello di risorsa, la maggiorparte delle policy specifica un carattere jolly (*) come il valore Resource. Se è necessario limitarele autorizzazioni a una regione specifica, tuttavia, il carattere jolly è sostituito con l'ARN appropriato:arn:aws:polly:region:account-id:lexicon/*.

API Amazon Polly e autorizzazioni necessarie per le operazioni

Operazione API: DeleteLexicon (p. 219)

Autorizzazioni richieste (operazione API): polly:DeleteLexicon

Risorse: arn:aws:polly:region:account-id:lexicon/LexiconNameOperazione API: DescribeVoices (p. 221)

Autorizzazioni richieste (operazione API): polly:DescribeVoices

Risorse: arn:aws:polly:region:account-id:lexicon/voice-nameOperazione API: GetLexicon (p. 224)

Autorizzazioni richieste (operazione API): polly:GetLexicon

Risorse: arn:aws:polly:region:account-id:lexicon/voice-nameOperazione API: ListLexicons (p. 228)

Autorizzazioni richieste (operazione API): polly:ListLexicons

Risorse: arn:aws:polly:region:account-id:lexicon/*Operazione API: PutLexicon (p. 232)

Autorizzazioni richieste (operazione API): polly:ListLexicons

Risorse: *Operazione API: SynthesizeSpeech (p. 240)

Autorizzazioni richieste (operazione API): polly:SynthesizeSpeech

Risorse: *

Logging e monitoraggio in Amazon PollyIl monitoraggio è importante per garantire l'affidabilità, la disponibilità e le prestazioni delle applicazioniAmazon Polly. Per monitorare le chiamate API Amazon Polly, utilizza AWS CloudTrail. Per monitorare lostato dei processi, utilizzare Amazon CloudWatch Logs.

• Allarmi Amazon CloudWatch –Utilizzando gli allarmi CloudWatch, è possibile osservare un singoloparametro per il periodo di tempo specificato. Se il parametro supera una determinata soglia, vieneinviata una notifica a un argomento Amazon Simple Notification Service o policy AWS Auto Scaling.Gli allarmi CloudWatch non invocano operazioni quando un parametro è in uno stato particolare. È

209

Amazon Polly Developer GuideConvalida della conformità

necessario invece cambiare lo stato e mantenerlo per un numero di periodi specificato. Per ulterioriinformazioni, consulta Integrazione di CloudWatch con Amazon Polly (p. 215).

• Log di AWS CloudTrail – CloudTrail fornisce un record delle operazioni eseguite da un utente, un ruoloo un servizio AWS in Amazon Polly. Con le informazioni raccolte da CloudTrail, puoi determinare qualerichiesta è stata effettuata a Amazon Polly. Puoi determinare l'indirizzo IP da cui è stata effettuata larichiesta, l'autore della richiesta, il momento in cui è stata effettuata e i dettagli aggiuntivi. Per ulterioriinformazioni, consulta Registrazione di chiamate API Amazon Polly con AWS CloudTrail (p. 212).

Convalida della conformità per Amazon PollyRevisori di terze parti valutano la sicurezza e la conformità di Amazon Polly come parte di più programmi diconformità di AWS. Questi includono SOC, PCI, FedRAMP, HIPAA e altri.

Per un elenco dei servizi AWS coperti da programmi di conformità specifici, consulta Servizi AWS copertidal programma di compliance. Per informazioni generali, consulta Programmi per la conformità di AWS.

Puoi scaricare i report di audit di terze parti utilizzando AWS Artifact. Per ulteriori informazioni, consultaDownload dei rapporti in AWS Artifact.

La responsabilità per la conformità quando utilizzi Amazon Polly è determinata dalla riservatezza dei dati,dagli obiettivi di conformità dell'azienda e dalle normative vigenti. AWS fornisce le risorse seguenti persemplificare la conformità:

• Guide Quick Start Sicurezza e compliance: queste guide alla distribuzione illustrano considerazionirelative all'architettura e forniscono procedure per la distribuzione di ambienti di base incentrati sullasicurezza e sulla conformità su AWS.

• Architecting for HIPAA Security and Compliance Whitepaper : questo whitepaper descrive in che modo leaziende possono utilizzare AWS per creare applicazioni conformi ai requisiti HIPAA.

• Risorse per la conformità AWS: questa raccolta di cartelle di lavoro e guide potrebbe essere utile perl'industria e la posizione.

• Valutazione delle risorse con le regole nella Guida per gli sviluppatori di AWS Config: il servizio AWSAWS Config valuta il livello di conformità delle configurazioni delle risorse con pratiche interne, lineeguida e regolamenti industriali.

• AWS Security Hub: questo servizio AWS fornisce una visione completa dello stato di sicurezza all'internodi AWS che consente di verificare la conformità con standard industriali di sicurezza e best practice.

Resilienza in Amazon PollyL'infrastruttura globale di AWS è basata su regioni e zone di disponibilità AWS. Le regioni AWS fornisconopiù zone di disponibilità fisicamente separate e isolate che sono connesse tramite reti altamente ridondanti,a bassa latenza e throughput elevato. Con le zone di disponibilità, è possibile progettare e gestireapplicazioni e database che eseguono il failover automatico tra zone di disponibilità senza interruzioni.Le zone di disponibilità sono più disponibili, tolleranti ai guasti e scalabili rispetto alle infrastrutture a datacenter singolo o multiplo.

Per ulteriori informazioni sulle regioni e le zone di disponibilità AWS, consulta Infrastruttura globale di AWS.

Sicurezza dell'infrastruttura in Amazon PollyIn qualità di servizio gestito, Amazon Polly è protetto dalle procedure di sicurezza di rete globali di AWSdescritte nel whitepaper Amazon Web Services: panoramica dei processi di sicurezza.

210




https://docs.aws.amazon.com/artifact/latest/ug/downloading-documents.html

http://aws.amazon.com/quickstart/?awsf.quickstart-homepage-filter=categories%23security-identity-compliance

https://d0.awsstatic.com/whitepapers/compliance/AWS_HIPAA_Compliance_Whitepaper.pdf

http://aws.amazon.com/compliance/resources/

https://docs.aws.amazon.com/config/latest/developerguide/evaluate-config.html

https://docs.aws.amazon.com/securityhub/latest/userguide/what-is-securityhub.html

http://aws.amazon.com/about-aws/global-infrastructure/

https://d0.awsstatic.com/whitepapers/Security/AWS_Security_Whitepaper.pdf

Amazon Polly Developer GuideBest practice di sicurezza

Utilizza le chiamate all'API pubblicate di AWS per accedere ad Amazon Polly tramite la rete. I client devonosupportare Transport Layer Security (TLS) 1.0 o versioni successive. È consigliabile TLS 1.2 o versionisuccessive. I client devono, inoltre, supportare le suite di cifratura con PFS (Perfect Forward Secrecy), adesempio Ephemeral Diffie-Hellman (DHE) o Elliptic Curve Ephemeral Diffie-Hellman (ECDHE). La maggiorparte dei sistemi moderni come Java 7 e versioni successive, supporta tali modalità.

Inoltre, le richieste devono essere firmate utilizzando un ID chiave di accesso e una chiave di accessosegreta che è associata a un'entità IAM. In alternativa, è possibile utilizzare AWS Security Token Service(AWS STS) per generare le credenziali di sicurezza temporanee per firmare le richieste.

Best practice relative alla sicurezza di Amazon PollyLa tua fiducia, la tua privacy e la sicurezza dei tuoi contenuti sono le nostre maggiori priorità.Implementiamo controlli tecnici e fisici responsabili e sofisticati progettati per impedire l'accesso nonautorizzato o la divulgazione dei tuoi contenuti e garantire che il nostro utilizzo rispetti i nostri impegni neituoi confronti. Per maggiori informazioni, consulta le domande frequenti sulla privacy dei dati in AWS.

Amazon Polly non conserva il contenuto degli invii di testo.

Per una conoscenza approfondita della sicurezza in AWS, inclusi conformità, test di penetrazione, bollettinie risorse, visita il sito Web AWS Cloud Security .

211

https://docs.aws.amazon.com/STS/latest/APIReference/Welcome.html

https://aws.amazon.com/compliance/data-privacy-faq/

https://aws.amazon.com/security/

Amazon Polly Developer GuideInformazioni di Amazon Polly in CloudTrail

Registrazione di chiamate APIAmazon Polly con AWS CloudTrail

Amazon Polly è integrato con AWS CloudTrail, un servizio che offre un record delle operazioni eseguiteda un utente, un ruolo o un servizio AWS in Amazon Polly. CloudTrail acquisisce tutte le chiamate APIper Amazon Polly come eventi. Le chiamate acquisite includono le chiamate dalla console di AmazonPolly e le chiamate di codice alle operazioni delle API Amazon Polly. Se crei un trail, puoi abilitare ladistribuzione continua di eventi CloudTrail in un bucket Amazon S3 includendo eventi per Amazon Polly.Se non configuri un trail, è comunque possibile visualizzare gli eventi più recenti nella console di CloudTrailin Event history (Cronologia eventi). Le informazioni raccolte da CloudTrail consentono di determinare larichiesta effettuata a Amazon Polly, l'indirizzo IP da cui è stata eseguita la richiesta, l'autore della richiesta,il momento in cui è stata eseguita e altri dettagli.

Per ulteriori informazioni su CloudTrail, incluse le modalità di configurazione e abilitazione, consulta la AWSCloudTrail User Guide.

Informazioni di Amazon Polly in CloudTrailCloudTrail è abilitato sull'account AWS al momento della sua creazione. Quando si verifica un'attività deglieventi supportati in Amazon Polly, questa viene registrata in un evento CloudTrail insieme ad altri eventidel servizio AWS in Event history (Cronologia eventi). È possibile visualizzare, cercare e scaricare glieventi recenti nell'account AWS. Per ulteriori informazioni, consulta Visualizzazione di eventi mediante lacronologia eventi di CloudTrail.

Per una registrazione continua degli eventi nell'account AWS che includa eventi per Amazon Polly, creaun trail. Un trail consente a CloudTrail di fornire i file di log in un bucket Amazon S3. Per impostazionepredefinita, quando crei un trail nella console, il trail si applica a tutte le regioni AWS. Il trail registra glieventi di tutte le regioni nella partizione AWS e distribuisce i file di log nel bucket Amazon S3 specificato.Inoltre, puoi configurare altri servizi AWS per analizzare con maggiore dettaglio e usare i dati raccolti neilog CloudTrail. Per ulteriori informazioni, consulta gli argomenti seguenti:

• Panoramica della creazione di un trail• Servizi e integrazioni CloudTrail supportati• Configurazione delle notifiche Amazon SNS per CloudTrail• Ricezione di file di log CloudTrail da più regioni e Ricezione di file di log CloudTrail da più account

Amazon Polly supporta la registrazione delle seguenti operazioni come eventi nei file di log di CloudTrail:

• DeleteLexicon (p. 219)• DescribeVoices (p. 221)• GetLexicon (p. 224)• GetSpeechSynthesisTask (p. 226)• ListLexicons (p. 228)• ListSpeechSynthesisTasks (p. 230)• PutLexicon (p. 232)• StartSpeechSynthesisTask (p. 234)• SynthesizeSpeech (p. 240)

212

https://docs.aws.amazon.com/awscloudtrail/latest/userguide/

https://docs.aws.amazon.com/awscloudtrail/latest/userguide/

https://docs.aws.amazon.com/awscloudtrail/latest/userguide/view-cloudtrail-events.html

https://docs.aws.amazon.com/awscloudtrail/latest/userguide/view-cloudtrail-events.html

https://docs.aws.amazon.com/awscloudtrail/latest/userguide/cloudtrail-create-and-update-a-trail.html

https://docs.aws.amazon.com/awscloudtrail/latest/userguide/cloudtrail-aws-service-specific-topics.html#cloudtrail-aws-service-specific-topics-integrations

https://docs.aws.amazon.com/awscloudtrail/latest/userguide/getting_notifications_top_level.html

https://docs.aws.amazon.com/awscloudtrail/latest/userguide/receive-cloudtrail-log-files-from-multiple-regions.html

https://docs.aws.amazon.com/awscloudtrail/latest/userguide/cloudtrail-receive-logs-from-multiple-accounts.html

Amazon Polly Developer GuideEsempio di voci di file di log di Amazon Polly

Ogni evento o voce di log contiene informazioni sull'utente che ha generato la richiesta. Le informazioni diidentità consentono di determinare quanto segue:

• Se la richiesta è stata effettuata con le credenziali utente AWS Identity and Access Management (IAM) oroot.

• Se la richiesta è stata effettuata con le credenziali di sicurezza temporanee per un ruolo o un utentefederato.

• Se la richiesta è stata effettuata da un altro servizio AWS.

Per ulteriori informazioni, consulta Elemento CloudTrail userIdentity.

Esempio di voci di file di log di Amazon PollyUn trail è una configurazione che consente la distribuzione di eventi come file di log in un bucketAmazon S3 specificato. I file di log di CloudTrail contengono una o più voci di log. Un evento rappresentauna singola richiesta da qualsiasi sorgente e include informazioni sull'azione richiesta, la data e l'oradell'operazione, i parametri della richiesta e così via. I file di log di CloudTrail non sono una traccia di stackordinata delle chiamate API pubbliche, pertanto non vengono visualizzati in un ordine specifico.

L'esempio seguente mostra una voce di log di CloudTrail che illustra l'operazione SynthesizeSpeech.

{ "Records": [ { "awsRegion": "us-east-2", "eventID": "19bd70f7-5e60-4cdc-9825-936c552278ae", "eventName": "SynthesizeSpeech", "eventSource": "polly.amazonaws.com", "eventTime": "2016-11-02T03:49:39Z", "eventType": "AwsApiCall", "eventVersion": "1.05", "recipientAccountId": "123456789012", "requestID": "414288c2-a1af-11e6-b17f-d7cfc06cb461", "requestParameters": { "lexiconNames": [ "SampleLexicon" ], "outputFormat": "mp3", "sampleRate": "22050", "text": "**********", "textType": "text", "voiceId": "Kendra" }, "responseElements": { "contentType": "audio/mpeg", "requestCharacters": 25 }, "sourceIPAddress": "1.2.3.4", "userAgent": "Amazon CLI/Polly 1.10 API 2016-06-10", "userIdentity": { "accessKeyId": "EXAMPLE_KEY_ID", "accountId": "123456789012", "arn": "arn:aws:iam::123456789012:user/Alice", "principalId": "EX_PRINCIPAL_ID", "type": "IAMUser", "userName": "Alice" } }

213

https://docs.aws.amazon.com/awscloudtrail/latest/userguide/cloudtrail-event-reference-user-identity.html

Amazon Polly Developer GuideEsempio di voci di file di log di Amazon Polly

]}

214

Amazon Polly Developer GuideVisualizzazione dei parametri di CloudWatch (console)

Integrazione di CloudWatch conAmazon Polly

Quando interagisci con Amazon Polly, questo invia i parametri e le dimensioni seguenti a CloudWatch ogniminuto. Per visualizzare i parametri per Amazon Polly, puoi utilizzare le procedure seguenti.

Puoi monitorare Amazon Polly usando CloudWatch, che raccoglie i dati non elaborati da Amazon Polly e lielabora trasformandoli in parametri leggibili quasi in tempo reale. Queste statistiche vengono registrate perun periodo di due settimane, per permettere l'accesso a elementi di tipo historical information eper offrire una prospettiva migliore sulle prestazioni del servizio o dell'applicazione Web. Per impostazionepredefinita, i dati dei parametri di Amazon Polly vengono inviati a CloudWatch a intervalli di 1 minuto. Perulteriori informazioni, consulta Che cos'è Amazon CloudWatch? nella Guida per l'utente di CloudWatch.

Visualizzazione dei parametri di CloudWatch(console)

1. Aprire la console CloudWatch all'indirizzo https://console.aws.amazon.com/cloudwatch/.2. Nel riquadro di navigazione, scegliere Metrics (Parametri).3. Nel riquadro CloudWatch Metrics by Category (Parametri di CloudWatch per categoria), nella categoria

dei parametri per Amazon Polly selezionare una categoria di parametri e quindi, nel riquadro superiore,scorrere verso il basso per visualizzare l'elenco completo di parametri.

Visualizzazione dei parametri di CloudWatch (CLI)Il codice seguente consente di visualizzare i parametri disponibili per Amazon Polly.

aws cloudwatch list-metrics --namespace "AWS/Polly"

Il comando precedente restituisce un elenco di parametri di Amazon Polly analogo al seguente. L'elementoMetricName identifica il parametro.

{ "Metrics": [ { "Namespace": "AWS/Polly", "Dimensions": [ { "Name": "Operation", "Value": "SynthesizeSpeech" } ], "MetricName": "ResponseLatency" }, {

215

https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/WhatIsCloudWatch.html

https://console.aws.amazon.com/cloudwatch/

Amazon Polly Developer GuideParametri di Amazon Polly

"Namespace": "AWS/Polly", "Dimensions": [ { "Name": "Operation", "Value": "SynthesizeSpeech" } ], "MetricName": "RequestCharacters" }

Per ulteriori informazioni, consulta GetMetricStatistics nella Documentazione di riferimento delle APIAmazon CloudWatch.

Parametri di Amazon PollyAmazon Polly produce i seguenti parametri per ciascuna richiesta. Questi parametri vengono aggregati einviati in intervalli di un minuto a CloudWatch dove sono disponibili.

Parametro Descrizione

RequestCharacters Il numero di caratteri nella richiesta. Questi sono solocaratteri fatturabili e non sono inclusi i tag SSML.

Dimensione valida: Operation

Statistiche valide: Minimum, Maximum, Average,SampleCount, Sum

Unità: numero

ResponseLatency La latenza tra il momento in cui la richiesta è stataeffettuata e l'inizio della risposta in streaming.

Dimensione valida: Operation (Operazione)

Statistiche valide: Minimum, Maximum, Average,SampleCount

Unità: millisecondi

2XXCount Restituzione del codice di livello HTTP 200 come rispostain caso di esito positivo.


Statistiche valide: Average, SampleCount, Sum

Unità: numero

4XXCount Restituzione del codice errore di livello HTTP 400 in casodi errore. Per ciascuna risposta in caso di esito positivoviene emesso uno zero (0).



Unità: numero

216

https://docs.aws.amazon.com/AmazonCloudWatch/latest/APIReference/API_GetMetricStatistics.html

Amazon Polly Developer GuideDimensioni per i parametri di Amazon Polly

Parametro Descrizione

5XXCount Restituzione del codice errore di livello HTTP 500 in casodi errore. Per ciascuna risposta in caso di esito positivoviene emesso uno zero (0).



Unità: numero

Dimensioni per i parametri di Amazon PollyI parametri di Amazon Polly utilizzano il namespace AWS/Polly e forniscono i parametri per le dimensioniseguenti:

Dimensione Descrizione

Operation I parametri sono raggruppati in base al metodoAPI a cui fanno riferimento. I valori possibili sonoSynthesizeSpeech, PutLexicon, DescribeVoices,ecc.

217

Amazon Polly Developer GuideActions

Amazon Polly Riferimento APIQuesta sezione contiene il riferimento API di Amazon Polly.

Note

Le chiamate API autenticate devono essere registrate tramite il processo di firma SignatureVersion 4. Per ulteriori informazioni, consulta Firma delle richieste API AWS nella Riferimentigenerali di Amazon Web Services.

Argomenti

• Actions (p. 218)• Data Types (p. 244)

ActionsThe following actions are supported:

• DeleteLexicon (p. 219)• DescribeVoices (p. 221)• GetLexicon (p. 224)• GetSpeechSynthesisTask (p. 226)• ListLexicons (p. 228)• ListSpeechSynthesisTasks (p. 230)• PutLexicon (p. 232)• StartSpeechSynthesisTask (p. 234)• SynthesizeSpeech (p. 240)

218

https://docs.aws.amazon.com/general/latest/gr/signing_aws_api_requests.html


DeleteLexiconDeletes the specified pronunciation lexicon stored in an AWS Region. A lexicon which has been deletedis not available for speech synthesis, nor is it possible to retrieve it using either the GetLexicon orListLexicon APIs.

For more information, see Managing Lexicons.

Request Syntax

DELETE /v1/lexicons/LexiconName HTTP/1.1

URI Request ParametersThe request uses the following URI parameters.

LexiconName (p. 219)

The name of the lexicon to delete. Must be an existing lexicon in the region.

Pattern: [0-9A-Za-z]{1,20}

Required: Yes

Request BodyThe request does not have a request body.

Response Syntax

HTTP/1.1 200

Response ElementsIf the action is successful, the service sends back an HTTP 200 response with an empty HTTP body.

ErrorsLexiconNotFoundException

Amazon Polly can't find the specified lexicon. This could be caused by a lexicon that is missing, itsname is misspelled or specifying a lexicon that is in a different region.

Verify that the lexicon exists, is in the region (see ListLexicons (p. 228)) and that you spelled its nameis spelled correctly. Then try again.

HTTP Status Code: 404ServiceFailureException

An unknown condition has caused a service failure.

HTTP Status Code: 500

219

https://docs.aws.amazon.com/polly/latest/dg/managing-lexicons.html


See AlsoFor more information about using this API in one of the language-specific AWS SDKs, see the following:

• AWS Command Line Interface• AWS SDK for .NET• AWS SDK for C++• AWS SDK for Go• AWS SDK for Java• AWS SDK for JavaScript• AWS SDK for PHP V3• AWS SDK for Python• AWS SDK for Ruby V3

220

https://docs.aws.amazon.com/goto/aws-cli/polly-2016-06-10/DeleteLexicon

https://docs.aws.amazon.com/goto/DotNetSDKV3/polly-2016-06-10/DeleteLexicon

https://docs.aws.amazon.com/goto/SdkForCpp/polly-2016-06-10/DeleteLexicon

https://docs.aws.amazon.com/goto/SdkForGoV1/polly-2016-06-10/DeleteLexicon

https://docs.aws.amazon.com/goto/SdkForJava/polly-2016-06-10/DeleteLexicon

https://docs.aws.amazon.com/goto/AWSJavaScriptSDK/polly-2016-06-10/DeleteLexicon

https://docs.aws.amazon.com/goto/SdkForPHPV3/polly-2016-06-10/DeleteLexicon

https://docs.aws.amazon.com/goto/boto3/polly-2016-06-10/DeleteLexicon

https://docs.aws.amazon.com/goto/SdkForRubyV3/polly-2016-06-10/DeleteLexicon

Amazon Polly Developer GuideDescribeVoices

DescribeVoicesReturns the list of voices that are available for use when requesting speech synthesis. Each voice speaksa specified language, is either male or female, and is identified by an ID, which is the ASCII version of thevoice name.

When synthesizing speech ( SynthesizeSpeech ), you provide the voice ID for the voice you want fromthe list of voices returned by DescribeVoices.

For example, you want your news reader application to read news in a specific language, but giving a userthe option to choose the voice. Using the DescribeVoices operation you can provide the user with a listof available voices to select from.

You can optionally specify a language code to filter the available voices. For example, if you specify en-US,the operation returns a list of all available US English voices.

This operation requires permissions to perform the polly:DescribeVoices action.

Request Syntax

GET /v1/voices?Engine=Engine&IncludeAdditionalLanguageCodes=IncludeAdditionalLanguageCodes&LanguageCode=LanguageCode&NextToken=NextToken HTTP/1.1


Engine (p. 221)

Specifies the engine (standard or neural) used by Amazon Polly when processing input text forspeech synthesis.

Valid Values: standard | neuralIncludeAdditionalLanguageCodes (p. 221)

Boolean value indicating whether to return any bilingual voices that use the specified language asan additional language. For instance, if you request all languages that use US English (es-US), andthere is an Italian voice that speaks both Italian (it-IT) and US English, that voice will be included if youspecify yes but not if you specify no.

LanguageCode (p. 221)

The language identification tag (ISO 639 code for the language name-ISO 3166 country code) forfiltering the list of voices returned. If you don't specify this optional parameter, all available voices arereturned.

Valid Values: arb | cmn-CN | cy-GB | da-DK | de-DE | en-AU | en-GB | en-GB-WLS| en-IN | en-US | es-ES | es-MX | es-US | fr-CA | fr-FR | is-IS | it-IT |ja-JP | hi-IN | ko-KR | nb-NO | nl-NL | pl-PL | pt-BR | pt-PT | ro-RO | ru-RU | sv-SE | tr-TR

NextToken (p. 221)

An opaque pagination token returned from the previous DescribeVoices operation. If present, thisindicates where to continue the listing.

Length Constraints: Minimum length of 0. Maximum length of 4096.

221



Response Syntax

HTTP/1.1 200Content-type: application/json

{ "NextToken": "string", "Voices": [ { "AdditionalLanguageCodes": [ "string" ], "Gender": "string", "Id": "string", "LanguageCode": "string", "LanguageName": "string", "Name": "string", "SupportedEngines": [ "string" ] } ]}

Response ElementsIf the action is successful, the service sends back an HTTP 200 response.

The following data is returned in JSON format by the service.

NextToken (p. 222)

The pagination token to use in the next request to continue the listing of voices. NextToken isreturned only if the response is truncated.

Type: String

Length Constraints: Minimum length of 0. Maximum length of 4096.Voices (p. 222)

A list of voices with their properties.

Type: Array of Voice (p. 252) objects

ErrorsInvalidNextTokenException

The NextToken is invalid. Verify that it's spelled correctly, and then try again.




222




223

https://docs.aws.amazon.com/goto/aws-cli/polly-2016-06-10/DescribeVoices

https://docs.aws.amazon.com/goto/DotNetSDKV3/polly-2016-06-10/DescribeVoices

https://docs.aws.amazon.com/goto/SdkForCpp/polly-2016-06-10/DescribeVoices

https://docs.aws.amazon.com/goto/SdkForGoV1/polly-2016-06-10/DescribeVoices

https://docs.aws.amazon.com/goto/SdkForJava/polly-2016-06-10/DescribeVoices

https://docs.aws.amazon.com/goto/AWSJavaScriptSDK/polly-2016-06-10/DescribeVoices

https://docs.aws.amazon.com/goto/SdkForPHPV3/polly-2016-06-10/DescribeVoices

https://docs.aws.amazon.com/goto/boto3/polly-2016-06-10/DescribeVoices

https://docs.aws.amazon.com/goto/SdkForRubyV3/polly-2016-06-10/DescribeVoices


GetLexiconReturns the content of the specified pronunciation lexicon stored in an AWS Region. For more information,see Managing Lexicons.

Request SyntaxGET /v1/lexicons/LexiconName HTTP/1.1



Name of the lexicon.


Required: Yes


Response SyntaxHTTP/1.1 200Content-type: application/json

{ "Lexicon": { "Content": "string", "Name": "string" }, "LexiconAttributes": { "Alphabet": "string", "LanguageCode": "string", "LastModified": number, "LexemesCount": number, "LexiconArn": "string", "Size": number }}



Lexicon (p. 224)

Lexicon object that provides name and the string content of the lexicon.

Type: Lexicon (p. 245) object

224



LexiconAttributes (p. 224)

Metadata of the lexicon, including phonetic alphabetic used, language code, lexicon ARN, number oflexemes defined in the lexicon, and size of lexicon in bytes.

Type: LexiconAttributes (p. 246) object

ErrorsLexiconNotFoundException








225

https://docs.aws.amazon.com/goto/aws-cli/polly-2016-06-10/GetLexicon

https://docs.aws.amazon.com/goto/DotNetSDKV3/polly-2016-06-10/GetLexicon

https://docs.aws.amazon.com/goto/SdkForCpp/polly-2016-06-10/GetLexicon

https://docs.aws.amazon.com/goto/SdkForGoV1/polly-2016-06-10/GetLexicon

https://docs.aws.amazon.com/goto/SdkForJava/polly-2016-06-10/GetLexicon

https://docs.aws.amazon.com/goto/AWSJavaScriptSDK/polly-2016-06-10/GetLexicon

https://docs.aws.amazon.com/goto/SdkForPHPV3/polly-2016-06-10/GetLexicon

https://docs.aws.amazon.com/goto/boto3/polly-2016-06-10/GetLexicon

https://docs.aws.amazon.com/goto/SdkForRubyV3/polly-2016-06-10/GetLexicon

Amazon Polly Developer GuideGetSpeechSynthesisTask

GetSpeechSynthesisTaskRetrieves a specific SpeechSynthesisTask object based on its TaskID. This object contains informationabout the given speech synthesis task, including the status of the task, and a link to the S3 bucketcontaining the output of the task.

Request SyntaxGET /v1/synthesisTasks/TaskId HTTP/1.1


TaskId (p. 226)

The Amazon Polly generated identifier for a speech synthesis task.

Pattern: ^[a-zA-Z0-9_-]{1,100}$

Required: Yes



{ "SynthesisTask": { "CreationTime": number, "Engine": "string", "LanguageCode": "string", "LexiconNames": [ "string" ], "OutputFormat": "string", "OutputUri": "string", "RequestCharacters": number, "SampleRate": "string", "SnsTopicArn": "string", "SpeechMarkTypes": [ "string" ], "TaskId": "string", "TaskStatus": "string", "TaskStatusReason": "string", "TextType": "string", "VoiceId": "string" }}



226

Amazon Polly Developer GuideGetSpeechSynthesisTask

SynthesisTask (p. 226)

SynthesisTask object that provides information from the requested task, including output format,creation time, task status, and so on.

Type: SynthesisTask (p. 249) object

ErrorsInvalidTaskIdException

The provided Task ID is not valid. Please provide a valid Task ID and try again.



HTTP Status Code: 500SynthesisTaskNotFoundException

The Speech Synthesis task with requested Task ID cannot be found.




227

https://docs.aws.amazon.com/goto/aws-cli/polly-2016-06-10/GetSpeechSynthesisTask

https://docs.aws.amazon.com/goto/DotNetSDKV3/polly-2016-06-10/GetSpeechSynthesisTask

https://docs.aws.amazon.com/goto/SdkForCpp/polly-2016-06-10/GetSpeechSynthesisTask

https://docs.aws.amazon.com/goto/SdkForGoV1/polly-2016-06-10/GetSpeechSynthesisTask

https://docs.aws.amazon.com/goto/SdkForJava/polly-2016-06-10/GetSpeechSynthesisTask

https://docs.aws.amazon.com/goto/AWSJavaScriptSDK/polly-2016-06-10/GetSpeechSynthesisTask

https://docs.aws.amazon.com/goto/SdkForPHPV3/polly-2016-06-10/GetSpeechSynthesisTask

https://docs.aws.amazon.com/goto/boto3/polly-2016-06-10/GetSpeechSynthesisTask

https://docs.aws.amazon.com/goto/SdkForRubyV3/polly-2016-06-10/GetSpeechSynthesisTask

Amazon Polly Developer GuideListLexicons

ListLexiconsReturns a list of pronunciation lexicons stored in an AWS Region. For more information, see ManagingLexicons.

Request Syntax

GET /v1/lexicons?NextToken=NextToken HTTP/1.1


NextToken (p. 228)

An opaque pagination token returned from previous ListLexicons operation. If present, indicateswhere to continue the list of lexicons.



Response Syntax

HTTP/1.1 200Content-type: application/json

{ "Lexicons": [ { "Attributes": { "Alphabet": "string", "LanguageCode": "string", "LastModified": number, "LexemesCount": number, "LexiconArn": "string", "Size": number }, "Name": "string" } ], "NextToken": "string"}



Lexicons (p. 228)

A list of lexicon names and attributes.

228



Amazon Polly Developer GuideListLexicons

Type: Array of LexiconDescription (p. 248) objectsNextToken (p. 228)

The pagination token to use in the next request to continue the listing of lexicons. NextToken isreturned only if the response is truncated.

Type: String









229

https://docs.aws.amazon.com/goto/aws-cli/polly-2016-06-10/ListLexicons

https://docs.aws.amazon.com/goto/DotNetSDKV3/polly-2016-06-10/ListLexicons

https://docs.aws.amazon.com/goto/SdkForCpp/polly-2016-06-10/ListLexicons

https://docs.aws.amazon.com/goto/SdkForGoV1/polly-2016-06-10/ListLexicons

https://docs.aws.amazon.com/goto/SdkForJava/polly-2016-06-10/ListLexicons

https://docs.aws.amazon.com/goto/AWSJavaScriptSDK/polly-2016-06-10/ListLexicons

https://docs.aws.amazon.com/goto/SdkForPHPV3/polly-2016-06-10/ListLexicons

https://docs.aws.amazon.com/goto/boto3/polly-2016-06-10/ListLexicons

https://docs.aws.amazon.com/goto/SdkForRubyV3/polly-2016-06-10/ListLexicons

Amazon Polly Developer GuideListSpeechSynthesisTasks

ListSpeechSynthesisTasksReturns a list of SpeechSynthesisTask objects ordered by their creation date. This operation can filter thetasks by their status, for example, allowing users to list only tasks that are completed.

Request SyntaxGET /v1/synthesisTasks?MaxResults=MaxResults&NextToken=NextToken&Status=Status HTTP/1.1


MaxResults (p. 230)

Maximum number of speech synthesis tasks returned in a List operation.

Valid Range: Minimum value of 1. Maximum value of 100.NextToken (p. 230)

The pagination token to use in the next request to continue the listing of speech synthesis tasks.

Length Constraints: Minimum length of 0. Maximum length of 4096.Status (p. 230)

Status of the speech synthesis tasks returned in a List operation

Valid Values: scheduled | inProgress | completed | failed



{ "NextToken": "string", "SynthesisTasks": [ { "CreationTime": number, "Engine": "string", "LanguageCode": "string", "LexiconNames": [ "string" ], "OutputFormat": "string", "OutputUri": "string", "RequestCharacters": number, "SampleRate": "string", "SnsTopicArn": "string", "SpeechMarkTypes": [ "string" ], "TaskId": "string", "TaskStatus": "string", "TaskStatusReason": "string", "TextType": "string", "VoiceId": "string"

230

Amazon Polly Developer GuideListSpeechSynthesisTasks

} ]}



NextToken (p. 230)

An opaque pagination token returned from the previous List operation in this request. If present, thisindicates where to continue the listing.

Type: String

Length Constraints: Minimum length of 0. Maximum length of 4096.SynthesisTasks (p. 230)

List of SynthesisTask objects that provides information from the specified task in the list request,including output format, creation time, task status, and so on.

Type: Array of SynthesisTask (p. 249) objects








231

https://docs.aws.amazon.com/goto/aws-cli/polly-2016-06-10/ListSpeechSynthesisTasks

https://docs.aws.amazon.com/goto/DotNetSDKV3/polly-2016-06-10/ListSpeechSynthesisTasks

https://docs.aws.amazon.com/goto/SdkForCpp/polly-2016-06-10/ListSpeechSynthesisTasks

https://docs.aws.amazon.com/goto/SdkForGoV1/polly-2016-06-10/ListSpeechSynthesisTasks

https://docs.aws.amazon.com/goto/SdkForJava/polly-2016-06-10/ListSpeechSynthesisTasks

https://docs.aws.amazon.com/goto/AWSJavaScriptSDK/polly-2016-06-10/ListSpeechSynthesisTasks

https://docs.aws.amazon.com/goto/SdkForPHPV3/polly-2016-06-10/ListSpeechSynthesisTasks

https://docs.aws.amazon.com/goto/boto3/polly-2016-06-10/ListSpeechSynthesisTasks

https://docs.aws.amazon.com/goto/SdkForRubyV3/polly-2016-06-10/ListSpeechSynthesisTasks


PutLexiconStores a pronunciation lexicon in an AWS Region. If a lexicon with the same name already exists in theregion, it is overwritten by the new lexicon. Lexicon operations have eventual consistency, therefore, itmight take some time before the lexicon is available to the SynthesizeSpeech operation.

For more information, see Managing Lexicons.

Request SyntaxPUT /v1/lexicons/LexiconName HTTP/1.1Content-type: application/json

{ "Content": "string"}



Name of the lexicon. The name must follow the regular express format [0-9A-Za-z]{1,20}. That is, thename is a case-sensitive alphanumeric string up to 20 characters long.


Required: Yes

Request BodyThe request accepts the following data in JSON format.

Content (p. 232)

Content of the PLS lexicon as string data.

Type: String

Required: Yes

Response SyntaxHTTP/1.1 200

Response ElementsIf the action is successful, the service sends back an HTTP 200 response with an empty HTTP body.

ErrorsInvalidLexiconException

Amazon Polly can't find the specified lexicon. Verify that the lexicon's name is spelled correctly, andthen try again.

232



HTTP Status Code: 400LexiconSizeExceededException

The maximum size of the specified lexicon would be exceeded by this operation.

HTTP Status Code: 400MaxLexemeLengthExceededException

The maximum size of the lexeme would be exceeded by this operation.

HTTP Status Code: 400MaxLexiconsNumberExceededException

The maximum number of lexicons would be exceeded by this operation.



HTTP Status Code: 500UnsupportedPlsAlphabetException

The alphabet specified by the lexicon is not a supported alphabet. Valid values are x-sampa and ipa.

HTTP Status Code: 400UnsupportedPlsLanguageException

The language specified in the lexicon is unsupported. For a list of supported languages, see LexiconAttributes.




233

https://docs.aws.amazon.com/polly/latest/dg/API_LexiconAttributes.html

https://docs.aws.amazon.com/polly/latest/dg/API_LexiconAttributes.html

https://docs.aws.amazon.com/goto/aws-cli/polly-2016-06-10/PutLexicon

https://docs.aws.amazon.com/goto/DotNetSDKV3/polly-2016-06-10/PutLexicon

https://docs.aws.amazon.com/goto/SdkForCpp/polly-2016-06-10/PutLexicon

https://docs.aws.amazon.com/goto/SdkForGoV1/polly-2016-06-10/PutLexicon

https://docs.aws.amazon.com/goto/SdkForJava/polly-2016-06-10/PutLexicon

https://docs.aws.amazon.com/goto/AWSJavaScriptSDK/polly-2016-06-10/PutLexicon

https://docs.aws.amazon.com/goto/SdkForPHPV3/polly-2016-06-10/PutLexicon

https://docs.aws.amazon.com/goto/boto3/polly-2016-06-10/PutLexicon

https://docs.aws.amazon.com/goto/SdkForRubyV3/polly-2016-06-10/PutLexicon

Amazon Polly Developer GuideStartSpeechSynthesisTask

StartSpeechSynthesisTaskAllows the creation of an asynchronous synthesis task, by starting a new SpeechSynthesisTask.This operation requires all the standard information needed for speech synthesis, plus the name of anAmazon S3 bucket for the service to store the output of the synthesis task and two optional parameters(OutputS3KeyPrefix and SnsTopicArn). Once the synthesis task is created, this operation will return aSpeechSynthesisTask object, which will include an identifier of this task as well as the current status.

Request Syntax

POST /v1/synthesisTasks HTTP/1.1Content-type: application/json

{ "Engine": "string", "LanguageCode": "string", "LexiconNames": [ "string" ], "OutputFormat": "string", "OutputS3BucketName": "string", "OutputS3KeyPrefix": "string", "SampleRate": "string", "SnsTopicArn": "string", "SpeechMarkTypes": [ "string" ], "Text": "string", "TextType": "string", "VoiceId": "string"}

URI Request ParametersThe request does not use any URI parameters.


Engine (p. 234)

Specifies the engine (standard or neural) for Amazon Polly to use when processing input text forspeech synthesis. Using a voice that is not supported for the engine selected will result in an error.

Type: String

Valid Values: standard | neural

Required: NoLanguageCode (p. 234)

Optional language code for the Speech Synthesis request. This is only necessary if using a bilingualvoice, such as Aditi, which can be used for either Indian English (en-IN) or Hindi (hi-IN).

If a bilingual voice is used and no language code is specified, Amazon Polly will use the defaultlanguage of the bilingual voice. The default language for any voice is the one returned by theDescribeVoices operation for the LanguageCode parameter. For example, if no language code isspecified, Aditi will use Indian English rather than Hindi.

Type: String

234




Required: NoLexiconNames (p. 234)

List of one or more pronunciation lexicon names you want the service to apply during synthesis.Lexicons are applied only if the language of the lexicon is the same as the language of the voice.

Type: Array of strings

Array Members: Maximum number of 5 items.


Required: NoOutputFormat (p. 234)

The format in which the returned output will be encoded. For audio stream, this will be mp3,ogg_vorbis, or pcm. For speech marks, this will be json.

Type: String

Valid Values: json | mp3 | ogg_vorbis | pcm

Required: YesOutputS3BucketName (p. 234)

Amazon S3 bucket name to which the output file will be saved.

Type: String

Pattern: ^[a-z0-9][\.\-a-z0-9]{1,61}[a-z0-9]$

Required: YesOutputS3KeyPrefix (p. 234)

The Amazon S3 key prefix for the output speech file.

Type: String

Pattern: ^[0-9a-zA-Z\/\!\-_\.\*\']{0,800}$

Required: NoSampleRate (p. 234)

The audio frequency specified in Hz.

The valid values for mp3 and ogg_vorbis are "8000", "16000", "22050", and "24000". The default valuefor standard voices is "22050". The default value for neural voices is "24000".

Valid values for pcm are "8000" and "16000" The default value is "16000".

Type: String

Required: NoSnsTopicArn (p. 234)

ARN for the SNS topic optionally used for providing status notification for a speech synthesis task.

235


Type: String

Pattern: ^arn:aws(-(cn|iso(-b)?|us-gov))?:sns:[a-z0-9_-]{1,50}:\d{12}:[a-zA-Z0-9_-]{1,256}$

Required: NoSpeechMarkTypes (p. 234)

The type of speech marks returned for the input text.



Valid Values: sentence | ssml | viseme | word

Required: NoText (p. 234)

The input text to synthesize. If you specify ssml as the TextType, follow the SSML format for the inputtext.

Type: String

Required: YesTextType (p. 234)

Specifies whether the input text is plain text or SSML. The default value is plain text.

Type: String

Valid Values: ssml | text

Required: NoVoiceId (p. 234)

Voice ID to use for the synthesis.

Type: String

Valid Values: Aditi | Amy | Astrid | Bianca | Brian | Camila | Carla | Carmen| Celine | Chantal | Conchita | Cristiano | Dora | Emma | Enrique | Ewa| Filiz | Geraint | Giorgio | Gwyneth | Hans | Ines | Ivy | Jacek | Jan| Joanna | Joey | Justin | Karl | Kendra | Kimberly | Lea | Liv | Lotte |Lucia | Lupe | Mads | Maja | Marlene | Mathieu | Matthew | Maxim | Mia |Miguel | Mizuki | Naja | Nicole | Penelope | Raveena | Ricardo | Ruben |Russell | Salli | Seoyeon | Takumi | Tatyana | Vicki | Vitoria | Zeina |Zhiyu

Required: Yes


{ "SynthesisTask": { "CreationTime": number,

236


"Engine": "string", "LanguageCode": "string", "LexiconNames": [ "string" ], "OutputFormat": "string", "OutputUri": "string", "RequestCharacters": number, "SampleRate": "string", "SnsTopicArn": "string", "SpeechMarkTypes": [ "string" ], "TaskId": "string", "TaskStatus": "string", "TaskStatusReason": "string", "TextType": "string", "VoiceId": "string" }}



SynthesisTask (p. 236)

SynthesisTask object that provides information and attributes about a newly submitted speechsynthesis task.

Type: SynthesisTask (p. 249) object

ErrorsEngineNotSupportedException

This engine is not compatible with the voice that you have designated. Choose a new voice that iscompatible with the engine or change the engine and restart the operation.

HTTP Status Code: 400InvalidS3BucketException

The provided Amazon S3 bucket name is invalid. Please check your input with S3 bucket namingrequirements and try again.

HTTP Status Code: 400InvalidS3KeyException

The provided Amazon S3 key prefix is invalid. Please provide a valid S3 object key name.

HTTP Status Code: 400InvalidSampleRateException

The specified sample rate is not valid.

HTTP Status Code: 400InvalidSnsTopicArnException

The provided SNS topic ARN is invalid. Please provide a valid SNS topic ARN and try again.


237


InvalidSsmlException

The SSML you provided is invalid. Verify the SSML syntax, spelling of tags and values, and then tryagain.

HTTP Status Code: 400LanguageNotSupportedException

The language specified is not currently supported by Amazon Polly in this capacity.

HTTP Status Code: 400LexiconNotFoundException



HTTP Status Code: 404MarksNotSupportedForFormatException

Speech marks are not supported for the OutputFormat selected. Speech marks are only available forcontent in json format.



HTTP Status Code: 500SsmlMarksNotSupportedForTextTypeException

SSML speech marks are not supported for plain text-type input.

HTTP Status Code: 400TextLengthExceededException

The value of the "Text" parameter is longer than the accepted limits. For the SynthesizeSpeech API,the limit for input text is a maximum of 6000 characters total, of which no more than 3000 can be billedcharacters. For the StartSpeechSynthesisTask API, the maximum is 200,000 characters, of whichno more than 100,000 can be billed characters. SSML tags are not counted as billed characters.



• AWS Command Line Interface• AWS SDK for .NET• AWS SDK for C++• AWS SDK for Go• AWS SDK for Java• AWS SDK for JavaScript• AWS SDK for PHP V3

238

https://docs.aws.amazon.com/goto/aws-cli/polly-2016-06-10/StartSpeechSynthesisTask

https://docs.aws.amazon.com/goto/DotNetSDKV3/polly-2016-06-10/StartSpeechSynthesisTask

https://docs.aws.amazon.com/goto/SdkForCpp/polly-2016-06-10/StartSpeechSynthesisTask

https://docs.aws.amazon.com/goto/SdkForGoV1/polly-2016-06-10/StartSpeechSynthesisTask

https://docs.aws.amazon.com/goto/SdkForJava/polly-2016-06-10/StartSpeechSynthesisTask

https://docs.aws.amazon.com/goto/AWSJavaScriptSDK/polly-2016-06-10/StartSpeechSynthesisTask

https://docs.aws.amazon.com/goto/SdkForPHPV3/polly-2016-06-10/StartSpeechSynthesisTask


• AWS SDK for Python• AWS SDK for Ruby V3

239

https://docs.aws.amazon.com/goto/boto3/polly-2016-06-10/StartSpeechSynthesisTask

https://docs.aws.amazon.com/goto/SdkForRubyV3/polly-2016-06-10/StartSpeechSynthesisTask

Amazon Polly Developer GuideSynthesizeSpeech

SynthesizeSpeechSynthesizes UTF-8 input, plain text or SSML, to a stream of bytes. SSML input must be valid, well-formedSSML. Some alphabets might not be available with all the voices (for example, Cyrillic might not be read atall by English voices) unless phoneme mapping is used. For more information, see How it Works.

Request Syntax

POST /v1/speech HTTP/1.1Content-type: application/json

{ "Engine": "string", "LanguageCode": "string", "LexiconNames": [ "string" ], "OutputFormat": "string", "SampleRate": "string", "SpeechMarkTypes": [ "string" ], "Text": "string", "TextType": "string", "VoiceId": "string"}

URI Request ParametersThe request does not use any URI parameters.


Engine (p. 240)

Specifies the engine (standard or neural) for Amazon Polly to use when processing input text forspeech synthesis. For information on Amazon Polly voices and which voices are available in standard-only, NTTS-only, and both standard and NTTS formats, see Available Voices.

NTTS-only voices

When using NTTS-only voices such as Kevin (en-US), this parameter is required and must be set toneural. If the engine is not specified, or is set to standard, this will result in an error.

Type: String


Required: Yes

Standard voices

For standard voices, this is not required; the engine parameter defaults to standard. If the engine isnot specified, or is set to standard and an NTTS-only voice is selected, this will result in an error.

Type: String


Required: No

240

https://docs.aws.amazon.com/polly/latest/dg/how-text-to-speech-works.html

https://docs.aws.amazon.com/polly/latest/dg/voicelist.html


LanguageCode (p. 240)

Optional language code for the Synthesize Speech request. This is only necessary if using a bilingualvoice, such as Aditi, which can be used for either Indian English (en-IN) or Hindi (hi-IN).


Type: String


Required: NoLexiconNames (p. 240)

List of one or more pronunciation lexicon names you want the service to apply during synthesis.Lexicons are applied only if the language of the lexicon is the same as the language of the voice. Forinformation about storing lexicons, see PutLexicon.




Required: NoOutputFormat (p. 240)


When pcm is used, the content returned is audio/pcm in a signed 16-bit, 1 channel (mono), little-endianformat.

Type: String


Required: YesSampleRate (p. 240)




Type: String

Required: NoSpeechMarkTypes (p. 240)



241






Required: NoText (p. 240)

Input text to synthesize. If you specify ssml as the TextType, follow the SSML format for the inputtext.

Type: String

Required: YesTextType (p. 240)

Specifies whether the input text is plain text or SSML. The default value is plain text. For moreinformation, see Using SSML.

Type: String


Required: NoVoiceId (p. 240)

Voice ID to use for the synthesis. You can get a list of available voice IDs by calling the DescribeVoicesoperation.

Type: String


Required: Yes

Response SyntaxHTTP/1.1 200Content-Type: ContentTypex-amzn-RequestCharacters: RequestCharacters

AudioStream


The response returns the following HTTP headers.

ContentType (p. 242)

Specifies the type audio stream. This should reflect the OutputFormat parameter in your request.

242

https://docs.aws.amazon.com/polly/latest/dg/ssml.html



• If you request mp3 as the OutputFormat, the ContentType returned is audio/mpeg.• If you request ogg_vorbis as the OutputFormat, the ContentType returned is audio/ogg.• If you request pcm as the OutputFormat, the ContentType returned is audio/pcm in a signed 16-

bit, 1 channel (mono), little-endian format.• If you request json as the OutputFormat, the ContentType returned is audio/json.

RequestCharacters (p. 242)

Number of characters synthesized.

The response returns the following as the HTTP body.

AudioStream (p. 242)

Stream containing the synthesized speech.

ErrorsEngineNotSupportedException

This engine is not compatible with the voice that you have designated. Choose a new voice that iscompatible with the engine or change the engine and restart the operation.

HTTP Status Code: 400InvalidSampleRateException

The specified sample rate is not valid.

HTTP Status Code: 400InvalidSsmlException

The SSML you provided is invalid. Verify the SSML syntax, spelling of tags and values, and then tryagain.

HTTP Status Code: 400LanguageNotSupportedException

The language specified is not currently supported by Amazon Polly in this capacity.

HTTP Status Code: 400LexiconNotFoundException



HTTP Status Code: 404MarksNotSupportedForFormatException

Speech marks are not supported for the OutputFormat selected. Speech marks are only available forcontent in json format.


243

Amazon Polly Developer GuideData Types

ServiceFailureException


HTTP Status Code: 500SsmlMarksNotSupportedForTextTypeException

SSML speech marks are not supported for plain text-type input.

HTTP Status Code: 400TextLengthExceededException

The value of the "Text" parameter is longer than the accepted limits. For the SynthesizeSpeech API,the limit for input text is a maximum of 6000 characters total, of which no more than 3000 can be billedcharacters. For the StartSpeechSynthesisTask API, the maximum is 200,000 characters, of whichno more than 100,000 can be billed characters. SSML tags are not counted as billed characters.




Data TypesThe following data types are supported:

• Lexicon (p. 245)• LexiconAttributes (p. 246)• LexiconDescription (p. 248)• SynthesisTask (p. 249)• Voice (p. 252)

244

https://docs.aws.amazon.com/goto/aws-cli/polly-2016-06-10/SynthesizeSpeech

https://docs.aws.amazon.com/goto/DotNetSDKV3/polly-2016-06-10/SynthesizeSpeech

https://docs.aws.amazon.com/goto/SdkForCpp/polly-2016-06-10/SynthesizeSpeech

https://docs.aws.amazon.com/goto/SdkForGoV1/polly-2016-06-10/SynthesizeSpeech

https://docs.aws.amazon.com/goto/SdkForJava/polly-2016-06-10/SynthesizeSpeech

https://docs.aws.amazon.com/goto/AWSJavaScriptSDK/polly-2016-06-10/SynthesizeSpeech

https://docs.aws.amazon.com/goto/SdkForPHPV3/polly-2016-06-10/SynthesizeSpeech

https://docs.aws.amazon.com/goto/boto3/polly-2016-06-10/SynthesizeSpeech

https://docs.aws.amazon.com/goto/SdkForRubyV3/polly-2016-06-10/SynthesizeSpeech

Amazon Polly Developer GuideLexicon

LexiconProvides lexicon name and lexicon content in string format. For more information, see PronunciationLexicon Specification (PLS) Version 1.0.

ContentsContent

Lexicon content in string format. The content of a lexicon must be in PLS format.

Type: String

Required: NoName


Type: String


Required: No


• AWS SDK for C++• AWS SDK for Go• AWS SDK for Java• AWS SDK for Ruby V3

245



https://docs.aws.amazon.com/goto/SdkForCpp/polly-2016-06-10/Lexicon

https://docs.aws.amazon.com/goto/SdkForGoV1/polly-2016-06-10/Lexicon

https://docs.aws.amazon.com/goto/SdkForJava/polly-2016-06-10/Lexicon

https://docs.aws.amazon.com/goto/SdkForRubyV3/polly-2016-06-10/Lexicon

Amazon Polly Developer GuideLexiconAttributes

LexiconAttributesContains metadata describing the lexicon such as the number of lexemes, language code, and so on. Formore information, see Managing Lexicons.

ContentsAlphabet

Phonetic alphabet used in the lexicon. Valid values are ipa and x-sampa.

Type: String

Required: NoLanguageCode

Language code that the lexicon applies to. A lexicon with a language code such as "en" would beapplied to all English languages (en-GB, en-US, en-AUS, en-WLS, and so on.

Type: String


Required: NoLastModified

Date lexicon was last modified (a timestamp value).

Type: Timestamp

Required: NoLexemesCount

Number of lexemes in the lexicon.

Type: Integer

Required: NoLexiconArn

Amazon Resource Name (ARN) of the lexicon.

Type: String

Required: NoSize

Total size of the lexicon, in characters.

Type: Integer

Required: No


246


Amazon Polly Developer GuideLexiconAttributes


247

https://docs.aws.amazon.com/goto/SdkForCpp/polly-2016-06-10/LexiconAttributes

https://docs.aws.amazon.com/goto/SdkForGoV1/polly-2016-06-10/LexiconAttributes

https://docs.aws.amazon.com/goto/SdkForJava/polly-2016-06-10/LexiconAttributes

https://docs.aws.amazon.com/goto/SdkForRubyV3/polly-2016-06-10/LexiconAttributes

Amazon Polly Developer GuideLexiconDescription

LexiconDescriptionDescribes the content of the lexicon.

ContentsAttributes

Provides lexicon metadata.

Type: LexiconAttributes (p. 246) object

Required: NoName


Type: String


Required: No



248

https://docs.aws.amazon.com/goto/SdkForCpp/polly-2016-06-10/LexiconDescription

https://docs.aws.amazon.com/goto/SdkForGoV1/polly-2016-06-10/LexiconDescription

https://docs.aws.amazon.com/goto/SdkForJava/polly-2016-06-10/LexiconDescription

https://docs.aws.amazon.com/goto/SdkForRubyV3/polly-2016-06-10/LexiconDescription

Amazon Polly Developer GuideSynthesisTask

SynthesisTaskSynthesisTask object that provides information about a speech synthesis task.

ContentsCreationTime

Timestamp for the time the synthesis task was started.

Type: Timestamp

Required: NoEngine

Specifies the engine (standard or neural) for Amazon Polly to use when processing input text forspeech synthesis. Using a voice that is not supported for the engine selected will result in an error.

Type: String



Optional language code for a synthesis task. This is only necessary if using a bilingual voice, such asAditi, which can be used for either Indian English (en-IN) or Hindi (hi-IN).


Type: String


Required: NoLexiconNames

List of one or more pronunciation lexicon names you want the service to apply during synthesis.Lexicons are applied only if the language of the lexicon is the same as the language of the voice.




Required: NoOutputFormat


Type: String

249




Required: NoOutputUri

Pathway for the output speech file.

Type: String

Required: NoRequestCharacters

Number of billable characters synthesized.

Type: Integer

Required: NoSampleRate




Type: String

Required: NoSnsTopicArn

ARN for the SNS topic optionally used for providing status notification for a speech synthesis task.

Type: String

Pattern: ^arn:aws(-(cn|iso(-b)?|us-gov))?:sns:[a-z0-9_-]{1,50}:\d{12}:[a-zA-Z0-9_-]{1,256}$

Required: NoSpeechMarkTypes





Required: NoTaskId

The Amazon Polly generated identifier for a speech synthesis task.

Type: String

Pattern: ^[a-zA-Z0-9_-]{1,100}$

Required: No

250


TaskStatus

Current status of the individual speech synthesis task.

Type: String

Valid Values: scheduled | inProgress | completed | failed

Required: NoTaskStatusReason

Reason for the current status of a specific speech synthesis task, including errors if the task has failed.

Type: String

Required: NoTextType

Specifies whether the input text is plain text or SSML. The default value is plain text.

Type: String


Required: NoVoiceId

Voice ID to use for the synthesis.

Type: String


Required: No



251

https://docs.aws.amazon.com/goto/SdkForCpp/polly-2016-06-10/SynthesisTask

https://docs.aws.amazon.com/goto/SdkForGoV1/polly-2016-06-10/SynthesisTask

https://docs.aws.amazon.com/goto/SdkForJava/polly-2016-06-10/SynthesisTask

https://docs.aws.amazon.com/goto/SdkForRubyV3/polly-2016-06-10/SynthesisTask

Amazon Polly Developer GuideVoice

VoiceDescription of the voice.

ContentsAdditionalLanguageCodes

Additional codes for languages available for the specified voice in addition to its default language.

For example, the default language for Aditi is Indian English (en-IN) because it was first used for thatlanguage. Since Aditi is bilingual and fluent in both Indian English and Hindi, this parameter wouldshow the code hi-IN.



Required: NoGender

Gender of the voice.

Type: String

Valid Values: Female | Male

Required: NoId

Amazon Polly assigned voice ID. This is the ID that you specify when calling the SynthesizeSpeechoperation.

Type: String



Language code of the voice.

Type: String


252

Amazon Polly Developer GuideVoice

Required: NoLanguageName

Human readable name of the language in English.

Type: String

Required: NoName

Name of the voice (for example, Salli, Kendra, etc.). This provides a human readable voice name thatyou might display in your application.

Type: String

Required: NoSupportedEngines

Specifies which engines (standard or neural) that are supported by a given voice.



Required: No



253

https://docs.aws.amazon.com/goto/SdkForCpp/polly-2016-06-10/Voice

https://docs.aws.amazon.com/goto/SdkForGoV1/polly-2016-06-10/Voice

https://docs.aws.amazon.com/goto/SdkForJava/polly-2016-06-10/Voice

https://docs.aws.amazon.com/goto/SdkForRubyV3/polly-2016-06-10/Voice


Cronologia dei documenti perAmazon Polly

La tabella che segue descrive le modifiche importanti apportate a ogni release della Guida per sviluppatoridi Amazon Polly. Per ricevere notifiche sugli aggiornamenti di questa documentazione, puoi abbonarti a unfeed RSS.

• Ultimo aggiornamento della documentazione: 16 giugno 2020

update-history-change update-history-description update-history-date

Nuova voce aggiunta (p. 254) Oltre alle voci di bambino di Ivye Justin, la nuova voce di unbambino, Kevin, è stata aggiuntaall'inglese americano (en-US).Questa nuova voce è di altissimaqualità ed è disponibile solocome voce NTTS. Come tutte levoci neurali, è supportata solo inquattro regioni: us-est-1 (Virginiasettentrionale), us-west-2(Oregon), eu-west-1 (Irlanda) eap-southeast-2 (Sydney). Perulteriori informazioni, consultaVoci NTTS.

June 16, 2020

Nuova voce disponibile per lostile Newscaster (p. 254)

Oltre alle voci di Matthew eJoanna per lo stile Newscaster,Amazon Polly ora fornisceun'opzione aggiuntiva perquesto stile di pronuncia.Utilizzando il motore neurale,è possibile utilizzare la voceLupe in spagnolo (americano)per lo stile Newscaster. Perulteriori informazioni, consultarela sezione relativa agli stili dipronuncia NTTS.

April 16, 2020

Nuova caratteristica (p. 254) Oltre allo stile di pronunciaNewscaster, Amazon Polly orafornisce un secondo stile dipronuncia NTTS per aiutartia sintetizzare ancora meglio ipassaggi di sintesi vocale. Lostile Conversational utilizza ilsistema neurale per generareun discorso in uno stile diconversazione più amichevoleed espressivo che può essereutilizzato in molti casi d'uso. Perulteriori informazioni, consultare

November 25, 2019

254

https://docs.aws.amazon.com/polly/latest/dg/ntts-voices-main.html

https://docs.aws.amazon.com/polly/latest/dg/ntts-speakingstyles.html



la sezione relativa agli stili dipronuncia NTTS.

Nuove voci aggiunte (p. 254) Aggiunte due nuove voci: Camila(femminile, Portoghese-Brasile)e Lupe (femmina, Spagnolo-StatiUniti).

October 23, 2019

Nuova caratteristicaaggiunta (p. 254)

Aggiunta di plugin Amazon Pollyper Windows per incorporarela gamma completa di vociAmazon Polly nelle applicazionicompatibili con Windows SAPI.

September 26, 2019

Nuova caratteristicaprincipale (p. 254)

Oltre alle voci standard di sintesivocale (TTS) supportate daAmazon Polly dal suo lancio,Amazon Polly ora fornisce unsistema Neural TTS (NTTS)migliorato in grado di offrire vocidi qualità ancora più elevata,fornendo così voci di sintesivocale estremamente naturalie simili a quelle umane. Perulteriori informazioni, consultala sezione relativa alla sintesivocale neurale.

July 30, 2019

Nuove voci aggiunte (p. 254) Nuove voci aggiunte: Lucia(femmina, spagnolo) e Bianca(femmina, italiano).

August 2, 2018

Nuova lingua aggiunta (p. 254) Nuova lingua aggiunta: spagnolo,Messico (es-MX). Questa linguautilizza la voce femminile di Mia.

August 2, 2018

Nuova lingua aggiunta (p. 254) Nuova lingua aggiunta: hindi(hi-IN). Questa voce utilizza lavoce femminile di Aditi, che vieneutilizzata anche per l'ingleseindiano, pertanto Aditi è la primavoce bilingue di Amazon Polly.

August 2, 2018

Nuova caratteristicaaggiunta (p. 254)

Aggiunta della sintesi vocale dilunghi passaggi di testo (fino a100.000 caratteri fatturati).

July 17, 2018

Nuova caratteristica SSMLaggiunta (p. 254)

Aggiunta della durata massimaper la sintesi vocale.

July 17, 2018

Nuova voce aggiunta (p. 254) Nuova voce aggiunta: Léa(femminile, francese).

June 5, 2018

Nuova lingua aggiunta (p. 254) Nuova lingua aggiunta: coreano(ko-KR).

June 4, 2018

Caratteristica ampliata (p. 254) Ampliamento della caratteristicaPlugin di WordPress per AmazonPolly, tra cui l'aggiunta difunzionalità di Amazon Translate.

June 4, 2018

255



https://docs.aws.amazon.com/polly/latest/dg/sapi-plugin.html

https://docs.aws.amazon.com/polly/latest/dg/sapi-plugin.html

https://docs.aws.amazon.com/polly/latest/dg/NTTS-main.html

https://docs.aws.amazon.com/polly/latest/dg/NTTS-main.html

https://docs.aws.amazon.com/polly/latest/dg/asynchronous.html

https://docs.aws.amazon.com/polly/latest/dg/asynchronous.html

https://docs.aws.amazon.com/polly/latest/dg/supported-ssml.html#maxduration-tag

https://docs.aws.amazon.com/polly/latest/dg/supported-ssml.html#maxduration-tag


Ampliamento regionale (p. 254) Ampliamento del servizioAmazon Polly a tutte le regionicommerciali.

June 4, 2018

Nuove voci aggiunte (p. 254) Due nuove voci aggiunte:Aditi (donna, anglo-indiana) eSeoyeon (donna, coreana).

November 15, 2017

Nuova caratteristica (p. 254) Aggiunta della nuovacaratteristica Contrassegni vocali,nonché un'espansione dellefunzionalità SSML.

April 19, 2017

Nuova guida (p. 254) La prima versione della Guida persviluppatori di Amazon Polly.

November 30, 2016

256

https://docs.aws.amazon.com/polly/latest/dg/speechmarks.html

https://docs.aws.amazon.com/polly/latest/dg/ssml.html


Glossario AWSPer la terminologia AWS più recente, consulta il glossario AWS nella AWS General Reference.

257

https://docs.aws.amazon.com/general/latest/gr/glos-chap.html

Amazon Polly - Developer Guide › it_it › polly › latest › dg › polly-dg.pdf · Amazon...

Documents

Transcript of Amazon Polly - Developer Guide › it_it › polly › latest › dg › polly-dg.pdf · Amazon...