Whisper

Tätä artikkelia tai sen osaa on pyydetty päivitettäväksi, koska sen sisältö on osin vanhentunut.
Voit auttaa Wikipediaa parantamalla artikkelia. Lisää tietoa saattaa olla keskustelusivulla.
Tarkennus: V3 on julkaistu marraskuussa 2023
Whisper
Kehittäjä OpenAI
Kehityshistoria
Ensijulkaisu 21. syyskuuta 2022
Tiedot
Ohjelmistotyyppi käännössovellus
Alusta OpenAI
Lisenssi MIT-lisenssi
Aiheesta muualla
Verkkosivusto
Infobox OK

Whisper on OpenAI:n kehittämä automaattinen puheentunnistusjärjestelmä. Whisper on julkaistu lokakuussa 2022. Järjestelmä voi tuottaa tekstiä äänisyötteistä. Whisper on kehitetty 680 000 tunnin monikielisellä verkkoaineistolla. Whisper mahdollistaa käännösversiot 99 kielelle sekä kääntämisen englanniksi.[1][2]

Ominaisuudet

Whisperin merkittävin ominaisuus on sen kestävyydessä. Monipuolisen harjoitusaineiston avulla järjestelmä pystyy ymmärtämään ja siirtämään puhetta eri aksenttien välillä. Whisper toimii myös meluisassa ympäristössä. Whisper kykenee kääntämään puhetta useilla eri kielillä. Whisper on toteutettu enkooderi-dekooderi-muuntajana ja se käsittelee syötettyä ääntä 30 sekunnin mittaisina kokonaisuuksina.[3]

Lähteet

  1. Introducing Whisper OpenAI. 21.9.2022. Viitattu 18.2.2024. (englanniksi)
  2. Cochard, David: Whisper : Speech Recognition Model Capable of Recognizing 99 Languages Medium. 13.11.2023. Viitattu 18.2.2024. (englanniksi)
  3. Kumar, Akhil: Whisper: A Breakthrough in Automatic Speech Recognition Medium. 10.10.2023. Viitattu 18.2.2024. (englanniksi)
  • n
  • k
  • m
OpenAI
Tuotteet
  • ChatGPT
  • DALL-E
  • GitHub Copilot
  • OpenAI Five
  • Sora
  • Whisper
Kielimallit
  • OpenAI Codex
  • GPT-kielimalliperhe
    • GPT-1
    • GPT-2
    • GPT-3
    • GPT-4
Henkilöt
  • Sam Altman
  • Mira Murati
  • Emmett Shear
  • Bret Taylor
  • Larry Summers
  • Adam D'Angelo
Lisää aiheesta
  • AI Dungeon
  • Auto-GPT
  • LangChain
  • Microsoft 365 Copilot
  • Microsoft Bing