Jeg kan ikke bevise at jeg er et menneske!

Jeg er blind og har ingen sjanse, men en "maskin" gjør meg kanskje til menneske likevel!

Skrevet av: Morten Tollefsen, 26.3.12

MTB: Dette er min personlige blogg, og artiklene er mer løse i stilen enn på f. eks medialt.no.

CAPTCHA (Completely Automated Public Turing test to tell Computers and Humans Apart) brukes for å avgjøre om du er et menneske eller en maskin. Vanligvis brukes forvrengte grafiske tegn og tall, og du må skrive inn tegnene i en tekstboks for å registrere konto, kommentere innlegg osv.

For noen måneder siden leste jeg en artikkel på Wikipedia. Den var nokså mangelfull så jeg skrev en god del lokalt på min PC som jeg tenkte å legge ut. Trodde egentlig jeg hadde en konto fra før, men i så fall var den slettet. Motet sank ikke av den grunn: Jeg registrerte en ny konto. Det gikk så fint så, helt til jeg skulle bekrefte opplysningene med en (gjett hva) CAPTCHA. Det var kun en grafisk kode, så hele greia gikk til Dundas. Jeg er blind og får ikke brukt den grafiske koden. Motet sank jo litt, da. Men jeg ga ikke helt opp. Jeg gikk til den amerikanske utgaven, og der var det i tillegg en lydversjon (audio captcha). Den klarte jeg å bruke, og under over alle under - jeg kunne nå også logge inn på norsk Wikipedia.

Grjunnen til å bruke CAPTCHA er å forhindre at det sendes inn spam (programmer/roboter som fyller ut skjema med søppel og sender inn om igjen og om igjen og om igjen og ...). Jeg har selv ansvaret for å følge opp en del web skjemaer og har forståelse for at det er nødvendig å hindre (eller redusere) søppelflommen.

I disse dager er jeg blitt trukket ut til å være en av deltakerne i en ønskedrøm arrangert av Lotto. Men, igjen, uten helt spesielle triks får jeg ikke stemt pga. en CAPTCHA! Mens andre "kandidater" kan sitte å stemme på seg selv, for de er jo mennesker, avvises jeg. Med andre ord antar systemet at nå er det ikke et menneske i den andre enden.

Jeg beviser at jeg er et menneske ved å bruke en maskin!

Er de grafiske CAPTCHaene så smarte at ikke maskiner klarer å knekke koden? Neida, det finnes løsninger. Løsninger som "den helt vanlige" blinde nettbrukeren ikke vet om. En slik løsning heter Webvisum (forøvrig den eneste jeg kjenner til, men det kan finnes flere).

Webvisum har fler funksjoner for å gjøre dårlige nettsider mer overkommelige, men i denne sammenheng altså en kodeknekker. Plugin'en til Firefox lar brukerne knekke (tror det var 6 pr. dag) captcha'er. Koden legges på utklippstavla, så er det bare å lime inn i riktig tekstfelt. Mer info: www.webvisum.com.

Alternative CAPTCHA varianter

Audio (lyd): Med en audio CAPTCHA er gjerne ideen å la et menneske si tegn eller ord. Bakgrunnsstøy legges på slik at det skal bli vanskelig for talegjenkjennere (ASR) å kjenne igjen hva som sies. Cocktail-party effekten gjør oss mennesker i stand til å fokusere på en stemme selv om det er mye støy. Likevel viser det seg at CAPTCHAer med lyd er vanskelige å bruke. Jeg tror det er to hovedgrunner til dette:

  • Coctail-party effekten blir ikke helt lik når lyden spilles av i en høyttaler. I tillegg til at lydkvaliteten ofte er dårlig blir det derfor vanskelig å høre hva som sies.
  • Lyden spilles gjerne av i et eget program (dvs. ikke rett i nettleseren). Dette forvirrer mange brukere. I tillegg må du huske en sekvens av tegn eller ord, og det er mye vanskeligere enn å se tegnene som skal skrives inn mens du ser den grafiske representasjonen.

Lydbaserte CAPTCHAer er heller ikke et godt alternativ. De hindrer hørselshemmede i å identifisere seg som mennesker.

For små språk som norsk trengs kanskje ikke "scrambiling" av lyden? Jeg laget en lyd-captcha løsning for noen år siden. Tror ikke denne noen gang ble knukket av en maskin (ble brukt på blant annet dok.no).

Kombinert bilde/lyd: Det er ikke vanlig å bruke kun lydbaserte CAPTCHAer. Noen ganger er imidlertid lydversjoner lagt ut som et tillegg til den grafiske varianten. Du kan finne et eksempel dersom du prøver å registrere en konto på Facebook. Prøv hvor mange ganger du må høre på lyd-CAPTCHAen før du klarer å knekke koden. Går det første gang bør du vurdere å bli lydteknikker.

Regnestykker: Enkle regnestykker er en captcha-variant som ikke akkurat er vanlig. Problemet med disse er nok først og fremst at det er superenkelt å lage en maskin som regner ut "fem pluss ni minus to" (eller tilsvarende med tall). Særlig vanskelige regnestykker kan ikke brukes, da er det mange som får trøbbel!

Retoriske/enkle spørsmål: Helt enkle spørsmål brukes også noen steder. Dette kan kanskje fungere, men basen med spørsmål må nok være stor hvis det skal være en test på om systemet snakker med et menneske? Hvor smarte er forresten de smarteste maskinene? Klarer de også retoriske spørsmål, tro? Neppe på norsk i alle fall. Kom igjen, lag base, her er noen spørsmål å starte med:

  • Hvilken farge har den blå hatten?
  • Hva sitter hodet ditt festet på?
  • Hva er et glassøye laget av? (plastikk, kanskje, hehe)
  • ...

Det var ikke lett å lage så lette spørsmål! Men det kan kanskje funke?

Rekker med bilder/lyd: Ulike steder i verden forskes det på nye autentiseringsløsninger og varianter av captchaer. Sekvenser med bilder skal f. eks være enkle å huske, og det forskes også på lydsekvenser. Selv er jeg en smule skeptisk til om dette er tilfelle dersom graden av sikkerhet skal være identisk med de captcha'ene vi kjenner. Jeg vet imidlertid ikke nok om dette, så litt faglig oppdatering hadde nok vært lurt!

Pest eller cola

Det er vel ingen som synes captchaer er et fantastisk gode, men noen ganger må man vel velge mellom pest eller coma (forresten, cola er jo egentlig ganske godt - bare litt usunnt), kolera da. Alternative har vært lite utbredte autentiseringsløsninger. Nå er det imidlertid flere initiativer på gang, og kanskje er nettopp dette noe av problemet. Manglende standarder og behov for en del aktører for å posisjonere seg.

Der det er mulig er nok dataanalyse å foretrekke. Jeg skal ikke gi masse tips rundt dette i denne artikkelen, men det finnes mange smarte tips mht. å avgjøre om ting som sendes med et webskjema er ekte eller ikke. I avstemningen over (som er helt annonym) er det imidlertid ikke så enkelt å analysere data. Der er det jo kun captcha-koden som skal inn, så er stemmen avgitt.

Grafiske captchaer kan altså (som nevnt over) knekkes av maskiner, men ikke av alle mennesker. Litt mislykket i forhold til det de skal brukes til, altså!