RESULTATRAPPORT: Barnestemme-prosjektet

 

Skrevet av: Magne Lunde

Sist oppdatert: 27.12.2010

 

Bakgrunn og mål

Barn uten eller med mangelfull stemme må i dag bruke en syntetisk voksenstemme i sin kommunikasjon med andre. Det finnes bred støtte i internasjonal forskning om at dette er uheldig og at det er behov for en barnestemme:

  • Det har vist seg at syntetiske stemmer skaper ulike sosiale reaksjoner i omgivelsene, avhengig av hvordan de fremtrer og brukes. Personer viste seg for eksempel å reagere negativt på stemmer som ikke sammenfalt med situasjonen. En stemme som er mer naturlig i situasjonen, vil bedre reaksjonene fra omgivelsene.
  • Bruk av syntetisk stemme hos barn skaper et bedre kommunikasjonsgrunnlag som igjen styrker utvikling av språk. Med en tilgjengelig barnestemme vil trolig bruk av syntetisk tale bli langt mer attraktivt for målgruppen. I så fall vil en slik stemme være spesielt viktig for barn med lave kommunikasjonsferdigheter. Følgelig vil den ha ekstra stor betydning for barn med nedsatt taleevne og fremmedspråklig bakgrunn.
  • Bruk av kunstig stemme har vist seg å være en kommunikasjonsform som har positiv innvirkning på regulering av atferd hos målgruppen.
  • Forskning viser at stemme også assosieres med identitet, selv om det er gjort få studier av dette hos barn med nedsatt taleevne. Likevel er det ikke usannsynlig at barnas selvopplevelse kan styrkes gjennom en mer naturtro uttrykksmåte, særlig når stemmen også bedrer responsen fra omgivelsene.

 

På denne bakgrunn ble det formulert et mål i forprosjektet om å:

Undersøke hva som skal til for å utvikle en norsk syntetisk barnestemme.

 

Med basis i hovedmålet ble følgende delmål definert:

  • Analysere aktuell FoU innen syntetiske barnestemmer
  • Vurdere aktuell basisteknologi
  • Identifisere viktige FoU-utfordringer
  • Etablere internasjonalt samarbeid for å utvikle syntetiske barnestemmer
  • Legge grunnlaget for et hovedprosjekt, dersom dette er hensiktsmessig.

Primærmålgruppen i prosjektet var barn uten eller med mangelfull tale, hvor barn med Cerebral Parese utgjør en hovedgruppe. En viktig tilleggsgruppe er fremmedspråklige barn. Underveis i forprosjektet kom det opp en hypotese om at en barnestemme også kan komme synshemmede og dyslektiske barn til gode. Vår hypotese er at kunstige barnestemmer vil gjøre bruken mer naturlig og sosialt akseptert, og på den måten bidra til bedre læring og integrering. Bruk av barnestemmer for disse to gruppene har imidlertid vært lite fokusert, og en eventuell forskning på dette feltet vil således representere nybrottsarbeid.

 

Prosjektresultater

Prosjektresultatene samsvarer med oppsatte delmål:

 

Analysere aktuell FoU innen syntetiske barnestemmer: Referanser er samlet og lagt på prosjektets nettsider:

http://www.medialt.no/lenkerreferanser/846.aspx

Videre er aktuell forskning på området vurdert i forhold til aktuell basisteknologi, og disse vurderingene utgjør en integrert del av rapporten "Teknologi for utvikling av en norsk barnestemme" (se lenkereferanse under).

 

Vurdere aktuell basisteknologi: En vurdering av aktuell basisteknologi er foretatt i en egen rapport fra forprosjektet "Teknologi for utvikling av en norsk barnestemme":

http://www.medialt.no/teknologi-for-utvikling-av-en-norsk-barnestemme/1000.aspx

 

Identifisere viktige FoU-utfordringer: arbeidet med å identifisere de sentrale FOU-utfordringene har vært rettet inn mot videreføringen av arbeidet i mulige hovedprosjekter. De metodene som er tenkt anvendt i hovedprosjektene har aldri før vært prøvd ut i forhold til å ta fram en barnestemme, og dette gjør at forsknings- og utviklingsutfordringene er betydelige. De sentrale forskningsspørsmålene er:

  • Hvilke krav må stilles til kvalitet på datamateriale, dersom et barn skal være innleser? Herunder er utfordringer knyttet til konsentrasjon, jevn intensitet, ønsket grad av emosjonalitet, stemmekontroll etc. I forlengelsen av dette kan også spørsmålet stilles: I hvor stor grad kan det lempes på de kravene som stilles til en voksen innleser, og hva kan det i så fall lempes på?
  • Hvor gammelt må et barn være, før det har nytte/glede av en barnestemme?
  • Vil en barnestemme kunne brukes av barn i alle aldre? Hvis ikke, hvilke aldersgrupper bør ulike barnestemmer deles inn i?
  • Hvor mye tale må vi spille inn fra et barn?
  • Hvor mye tale er barn i forskjellige aldersgrupper i stand til å lese inn?
  • Hvilke karakteristikker/egenskaper bør et barn inneha, for at opptakene skal ha tilstrekkelig kvalitet?
  • Hvordan bør manuskriptet designes med tanke på at det skal leses inn av et barn og med utgangspunkt i at det skal gjenspeile et barns ordforråd?
  • Er det mulig å bruke stemmemodeller fra voksenstemmer for å underlette arbeidet med å lage barnestemmer, dvs anvende adapsjonsteknikk for å ta fram barnestemmer?
  • Hvis adapsjonsteknikk benyttes, er det da tilstrekkelig å ta utgangspunkt i en voksenstemme, eller må vi først lage en ungdomsstemme for å få et tilfredsstillende resultat?
  • Hvordan vil det påvirke kvaliteten på barnestemmen at adapsjonen forutsetter en matching av barnets talerstil og akustiske kvalitet?
  • Hva er en akseptabel kvalitet på en barnestemme, og i forlengelsen av dette: Hvordan bør brukertesting legges opp for å kunne måle dette på best mulig måte?

 

I tillegg til dette vil også forsknings- og utviklingsarbeidet stå overfor de samme forskningsutfordringene som vi møter generelt sett på dette fagfeltet. Fortsatt gjenstår mye arbeid før talesynteseteknologien klarer å ta fram "helt naturtro og kontekstuavhengige" stemmer.

 

Etablere internasjonalt samarbeid for å utvikle syntetiske barnestemmer: Vi har vært i kontakt med aktuelle leverandører av talesynteser, og interessen for et samarbeid knyttet til å ta fram en kunstig barnestemme har vært diskutert med dem. Kommersielle aktører som tilbyr norske stemmer er Acapela, Loquendo, Nuance, Lingit og Normedia. Acapela ser ikke noe kommersielt potensial i barnestemmer generelt, og absolutt ikke for små språk som norsk. Heller ikke Loquendo har utviklet spesifikke barnestemmer. Både Acapela og Loquendo foreslo å benytte voksenstemmer og endre parametre på disse som teknikk for å simulere barnestemmer. Nuance selger ikke synteser til sluttbruker. Disse syntesene bundles med ulike produkter (Talks, Jaws for Windows osv). I Barnestemme-prosjektet har vi derfor ikke tatt kontakt med Nuance. De to norske selskapene Lingit og Normedia var langt mer imøtekommende mht. å finne gode løsninger for barnestemmer. Av denne grunn ønsker vi å samarbeide med disse to selskapene om å utvikle norske barnestemmer.

 

Legge grunnlaget for et hovedprosjekt: Med bakgrunn i forprosjektet er det lagt et grunnlag for to hovedprosjekter. Disse to prosjektene bygger på samarbeid med henholdsvis Lingit og Normedia. Årsaken til at forsknings- og utviklingsarbeidet er skilt ut i to hovedprosjekter, er at ingen ennå har utviklet en kunstig barnestemme, og det knytter seg derfor forholdsvis stor usikkerhet til om vi vil lykkes med å ta fram en kunstig barnestemme med tilstrekkelig kvalitet. Av denne grunn mener vi at det er hensiktsmessig å prøve ut to ulike utviklingsteknikker; både for å øke sjansene for å lykkes og for å høste mest mulig erfaringer. Videre for å vurdere hvilke aldersgrupper de to utviklingsteknikkene fungerer best i forhold til.

 

FoU-oppgaver og sentrale miljøer

Prosjektet ble ledet av MediaLT. I tillegg har de mest sentrale miljøene vært Universitetet i Oslo, Haukåsen skole, Bredtvet kompetansesenter, Språkrådet, Norsk Lyd- og Blindeskriftsbibliotek, Abilia, Lingit og Normedia.

 

De sentrale oppgavene i prosjektet har vært å identifisere og analysere hva som tidligere har blitt gjort av forsknings- og utviklingsarbeid på fagfeltet, finne fram til og vurdere teknologi med tanke på å utvikle barnestemmer og i forlengelsen av dette peke på de mest sentrale forsknings- og utviklingsutfordringene på fagområdet.

 

Prosjektgjennomføring og ressursbruk

Ressursbruken i prosjektet er noe mindre enn budsjettert. Årsaken er mindre arbeidsinnsats fra samarbeidspartnerne enn forventet. Prosjektperioden ble forlenget med to måneder.  Dette skyldes at arbeidet med å få til en videreføring av forprosjektet var noe mer krevende enn antatt; ikke minst fordi det ble bestemt å satse på to hovedprosjekter.

 

Betydning/nytteverdi

Mye tyder på at barn uten eller med en mangelfull stemme vil bli bedre integrert i samfunnet, dersom de kunne bruke en kunstig barnestemme i stedet for en voksenstemme (jamfør kapittel: Bakgrunn og mål). Arbeidet i dette forprosjektet har lagt grunnlaget for utviklingen av en barnestemme, og prosjektet har således hatt stor nytteverdi og betydning for målgruppen.

 

Prosjektet har også gitt MediaLT mer kunnskap på fagfeltet norsk taleteknologi. En kunnskap som vil ha overføringsverdi i forhold til MediaLTs øvrige forsknings- og utviklingsarbeid på området. For Lingit og Normedia, som vil være de to utviklingspartnerne i hovedprosjektene, har forprosjektet frembrakt viktig kunnskap om innholdet i og hvordan de bør legge opp utviklingsarbeidet. Noe de også vil ha nytte av i sitt øvrige utviklingsarbeid med kunstige stemmer.

 

Utnyttelse av resultater og videre arbeid

Arbeidet i forprosjektet vil bli videreført i to hovedprosjekter. Begge disse to hovedprosjektene vil trekke stor nytte av arbeidet som er utført i forprosjektet, og resultatene fra forprosjektet vil således bli utnyttet til å ta fram to ulike typer barnestemmer.