KONSTEN ATT FÖRSTÅ EN LEDTRÅD Hur IBM Watson analyserar och förstår frågor i Jeopardy! DEN 10 JANUARI 2014 FRIDA ENGSLÄTT 729G43 729G43 – Artificiell Intelligens Projektarbete Frida Engslätt frien722 Sammanfattning Den här rapporten beskriver hur IBM Watson, en intelligent agent som tävlade och vann i Jeopardy! år 2011, tolkar och förstår frågorna i tävlingen. Watsons arkitektur kallas för DeepQA och består av hundratals komponenter som interagerar och kompletterar varandra så de tillsammans kan lösa svåra uppgifter och bidra till att Watson vinner Jeopardy!. Detta beskrivs i början av rapporten, innan jag går in i detalj på hur Watson, med hjälp av fyra viktiga komponenter i frågeanalysen, förstår naturligt språk och på så sätt kan förstå frågorna i Jeopardy!. 1 729G43 – Artificiell Intelligens Projektarbete Frida Engslätt frien722 Innehåll Sammanfattning ......................................................................................................................... 1 Inledning..................................................................................................................................... 3 Terminologi ................................................................................................................................ 4 Bakgrund .................................................................................................................................... 5 Vem är IBM Watson? ............................................................................................................ 5 QA-system .............................................................................................................................. 5 Natural Language Processing ................................................................................................. 6 UIMA ..................................................................................................................................... 6 Jeopardy! ................................................................................................................................ 6 Frågeanalysen i Watson ............................................................................................................. 8 General-purpose parsing och semantic analysis components ................................................ 8 Fokus ...................................................................................................................................... 8 LAT ........................................................................................................................................ 9 Undantag och svårigheter i upptäckandet av LATs ......................................................... 10 QClasses ............................................................................................................................... 11 QSections ............................................................................................................................. 12 Diskussion ................................................................................................................................ 13 Referenser................................................................................................................................. 15 2 729G43 – Artificiell Intelligens Projektarbete Frida Engslätt frien722 Inledning Intelligenta agenter är något som ständigt växer i dagens samhälle. En typ av intelligent agent är de så kallade QA-systemen, Question Answering systems, som automatiskt svarar på frågor som ställs med naturligt språk av människor. Den här rapporten bygger på IBMs projekt Watson, som är ett QA-system. År 2011 deltog Watson i TV-quiz showen Jeopardy! och vann över världens två bästa Jeopardy!-spelare. För att kunna vinna Jeopardy! krävs stor kunskap, snabbhet och smarthet. Deltagarna ska så snabbt som möjligt förstå de frågor som ställs, leta efter svaret, trycka på svars-knappen och besvara frågan under fem sekunder. Rätt svar ger poäng medan fel svar resulterar i straffavdrag. För att ett QA-system ska klara av uppgifter som Jeopardy! krävs bland annat Natural Language Processing (NLP) som hjälper till att analysera semantiken och syntaxen i det naturliga språket som utgör frågan. Syftet med det här projektet är att undersöka och förstå i detalj hur IBMs datorsystem Watson analyserar och förstår frågor i Jeopardy!. Bland annat beskrivs Watsons övergripande arkitektur och hur systemet bearbetar naturligt språk, men framför allt diskuteras de fyra komponenterna fokus, LAT, QClasses och QSections, som bildar frågeanalysen och bidrar till att Watson så snabbt som möjligt hittar ett svar till en fråga. I slutet av rapporten diskuteras även framtida möjligheter inom området. 3 729G43 – Artificiell Intelligens Projektarbete Frida Engslätt frien722 Terminologi Nedan följer en kort beskrivning av några begrepp som används i rapporten. QA-systems Question-answering systems är system som automatiskt kan svara på frågor som ställs utav människor i naturligt språk. Detta sker med hjälp av en kunskapsbas och ostrukturerade texter med naturligt språk som tolkas och analyseras med NLP-tekniker. NLP Natural Language Processing tekniker är textanalyser som analyserar syntaxen, kontexten och användarmönster för att förstå meningen och innebörden av texter och fraser. Detta hjälper systemen att förstå ostrukturerat språk. DeepQA DeepQA är arkitekturen bakom Watson. Den består av hundratals algoritmer som samarbetar och tillsammans klarar av att lösa stora uppgifter som hjälper Watson att svara på frågorna. IBM Watson IBM Watson är ett QA-system som 2011 tävlade i Jeopardy! och vann över två mänskliga motståndare. 4 729G43 – Artificiell Intelligens Projektarbete Frida Engslätt frien722 Bakgrund Vem är IBM Watson? IBM Watson är ett QA-system, byggt av IBM, som i februari 2011 deltog i Jeopardy! och vann över två mänskliga världsmästare i Jeopardy!. Inom loppet av tre sekunder analyserar Watson en fråga i form av en ledtråd och förstår vad ledtråden frågar efter, söker efter och bestämmer det bästa svaret och överväger om det är säkert nog att trycka på svars-knappen och svara. (Ferrucci D. A., 2011) För att kunna vinna Jeopardy var Watson, precis som de mänskliga deltagarna, tvungen att tävla i realtid med ledtrådar som varken Watson själv eller hans skapare någonsin tidigare sett. Watson tävlade dessutom helt på egen hand, utan tillgång till varken internet eller interaktion med människor för att kunna förstå och svara på frågorna. (Ferrucci D. A., 2011) Watson förstår inte varje enskilt ord i en fråga eller dess betydelse, utan kan istället se särdrag och mönster i mänskligt språk. Genom att bryta ner det naturliga språket till olika delar och förstå sammanhanget mellan dem kan Watson, med hjälp av bland annat textanalyser och en inbyggd kunskapsbas, hitta svaret på frågorna snabbare än vad en människa löser samma uppgift. (High, 2012) Watsons arkitektur kallas för DeepQA. Den består och använder sig av hundratals komponenter för att analysera naturligt språk, identifiera källor, hitta och generera hypoteser, värdesätta bevis samt för att undersöka och värdesätta hypoteser (Ferrucci, Brown , Chu-Carrol, & Fan, 2010). Komponenterna kan endast klara av enkla språkanalyser på egen hand, men tillsammans klarar de av större, mer utmanande uppgifter. Watson kan på så sätt prestera bra och vinna Jeopardy!. (Ferrucci D. A., 2011) Principen med DeepQA är att arkitekturen arbetar parallellt med många olika hypoteser och områden. Dessutom värdesätter den alternativ samt kombinerar ytlig och djup kunskap för att få så bra resultat som möjligt (Ferrucci, Brown , Chu-Carrol, & Fan, 2010). QA-system Question-answering (QA) systems är system som automatiskt kan svara på frågor ställda av människor med naturligt språk. Detta sker med hjälp av en kunskapsbas och ostrukturerade texter med naturligt språk som analyseras med textanalyser, i detta fall ESG och PAS som beskrivs senare i rapporten. Watson är ett så kallat Open-domain question-answering system, vilket kräver kunskap inom information retrieval (IR), natural-language processing (NLP), knowledge representation and reasoning (KR&R), machine learning, and human-computer 5 729G43 – Artificiell Intelligens Projektarbete Frida Engslätt frien722 interfaces (HCIs). (Ferrucci D. A., 2011) Natural Language Processing Mänsklig kommunikation bygger på ostrukturerad information, vilken ofta är ganska komplicerad och implicit. Informationen kräver för det mesta bakgrundsinformation och kontext för att en människa ska förstå och kunna analysera den. Programmeringsspråk är till skillnad från mänsklig kommunikation formellt matematiskt strukturerad i form av explicit information, exempelvis namn, adress och datum. Natural-language processing (NLP) tekniker analyserar syntaxen, kontexten och användarmönster för att förstå meningen och innebörden av texter och fraser och för att kunna förstå mänsklig kommunikation. Dock är det en enorm teknisk utmaning att lyckas få ett datorsystem att förstå mänskligt språk lika bra som människor, eftersom mänskligt språk består av många olika sätt att beskriva ett ord med samma innebörd. Samma ord kan även betyda olika saker beroende på kontexten. För att kunna tolka mänskligt språk så bra som möjligt kräver systemet tekniker så som ytlig tolkning, djup tolkning, informationsutvinning, att kunna tolka ords olika betydelser, dold semantisk analys och textimplikation. I vissa Opendomain QA-systemes går det att ta reda på hur många komponenter som interagerar med varandra för att NLP-teknikerna ska klara av svåra uppgifter (Ferrucci D. A., 2011). UIMA Watson innehåller för många komponenter för att vanliga NLP-tekniker ska klarar av att hantera all den information som behöver analyseras. Därför byggdes år 2001-2006 Unstructured Information Management Architecture (UIMA). Det är en mjukvara i form av en arkitektur som får informationskällor, så som texter, tal och bildanalyser, att interagera, oberoende av algoritmer, programmeringsspråk och domänmodeller. Det gör att all den ostrukturerad information som Watson tar in som input kan bli strukturerad med hjälp av UIMA, trots den enorma mängden data. (Ferrucci D. A., 2011) Jeopardy! Jeopardy! är ett underhållningsprogram i form av en quizshow som startades i USA år 1984. I Jeopardy! tävlar tre motståndare om kunskap, förtroende och snabbhet i tre ronder. Alla deltagare måste ha klarat ett test på 50 frågor för att få medverka i programmet. Frågorna är 6 729G43 – Artificiell Intelligens Projektarbete Frida Engslätt frien722 formulerade i naturligt språk och baserade utifrån en bred variation av generell kunskap. Det gör att Jeopardy! kräver smarta, kunniga och snabba deltagare. Programmet är ett fråga-svara program, men till skillnad från de flesta andra fråga-svara program läser programledaren en ledtråd i form av ett konstaterande istället för en vanlig fråga. Deltagarna ska i sin tur ge svaret i form av en fråga. Exempelvis: ”MATRÄTT: Denna maträtt gjord på kött är typiskt svensk, i form av små, runda bollar. Svar: Vad är Köttbullar.”. Under de två första ronderna används en tabell indelad i 6 kolumner med en kategori per kolumn, samt fem rader med stigande dollarvärden som dubblas i andra ronden. Vinnaren av föregående fråga väljer en kategori och ett dollarvärde. Ledtråden bakom rutan visas då och läses upp av programledaren inför alla tre deltagare. När programledaren har läst klart tänds en svars-knapp framför varje tävlande som visar att de, så länge knappen lyser, har chans att svara på ledtråden genom att trycka på knappen. Den deltagare som trycker först får fem sekunder på sig att svara på ledtråden, i form av en fråga. Rätt svar ger lika mycket dollar som ledtråden är värd och deltagaren får välja en ny ledtråd. Om deltagaren svarar fel dras summan för ledtråden bort från det totala belopp som deltagaren hittills har samlat ihop. Det gör det viktigt för deltagarna att vara säkra på sin sak när de trycker på knappen. Vid fel svar får de andra två deltagarna återigen chans att trycka på svars-knappen och svara på ledtråden. I den första och andra ronden finns det dessutom en, respektive två, rutor som är så kallad ”Daily Double”, vilket inte syns förens en tävlande har valt den rutan. Deltagaren som valt rutan måste då besvara ledtråden, utan att använda svars-knappen, samt satsa en del av sina hittills samlade pengar på frågan. Sista ronden är annorlunda från de två första och består av en enda fråga. Först avslöjas en kategori och varje deltagare skriver ner hur mycket de satsar på kommande fråga (det måste dock vara mindre eller lika mycket som den totala summa pengar de hittills har samlat ihop). Frågorna i rond tre är ofta svårare än de frågor som använts under rond ett och två. När programledaren läser upp ledtråden har deltagarna 30 sekunder på sig att svara. Sedan berättar de sina svar samt hur mycket de satsat på frågan. Den deltagare som har mest pengar efter den tredje ronden vinner Jeopardy! (Ferrucci, Brown , Chu-Carrol, & Fan, 2010). 7 729G43 – Artificiell Intelligens Projektarbete Frida Engslätt frien722 Frågeanalysen i Watson Watsons frågeanalys börjar med att göra en analys för att förstå vad som efterfrågas och hur det på bästa sätt besvaras. Frågeanalysen tar in frågan i form av ostrukturerad text och plockar utifrån det ut syntaktiska och semantiska delar som den kodar om till strukturerad information. Denna information kan sedan resterande delar av Watson ta del av, då nästan alla komponenter i systemet beror av frågeanalysen. Frågeanalysen bygger på så kallad generalpurpose parsing och semantic analysis components. (Lally, et al., 2012) Frågorna är alltid presenterade i versaler och det är så Watson uppfattar dem. Det är inget problem för människor att förstå text skriven enbart med versaler, men för datorsystem skapar det svårigheter. Detta eftersom systemen strängt följer syntaktiska regler där vissa typer av ord, så som namn, inleds med stor bokstav och på så sätt kan identifieras som just namn. För att underlätta detta används en så kallad true-caser component, vilket är en komponent som hjälper till att återställa sådan information som går förlorad när text skrivs i enbart versaler eller gemener. (Vita, Ittycheriah, Roukos, & Kambhatla, 2003) General-purpose parsing och semantic analysis components Watsons språkliga analys består av två djupa analyskomponenter, English Slot Grammar (ESG) parser och en predikat-argument struktur (PAS). ESG består av grammatiska träd, som både visar ytliga och djupa grammatiska strukturer. PAS är en förenkling av ESG genom att exempelvis undvika vissa termer som inte har någon större betydelse för resterande komponenter av systemet. Vissa begrepp tolkas därmed olika i ESG, men har bara en tolkning i PAS. PAS tar heller inte hänsyn till ytliga och djupa strukturer, utan lägger ihop dessa till en, som mestadels följer den djupa strukturen. ESG och PAS används av många olika komponenter i Watson, där frågeanalysen är en av dem. (Lally, et al., 2012) Fokus Fokus är det ord i ledtråden som refererar till svaret. Om fokus byts ut mot svaret blir frågan ett fullständigt påstående (Ferrucci, Brown , Chu-Carrol, & Fan, 2010). I Watsons system upptäcks fokus i en fråga utifrån regler som har identifierats i Jeopardy-frågor. Dessa följs i en prioriterad ordning enligt följande, där kursiv text står för fokus: - En substantiv fras med determineraren ”denna/detta/den här/det här” eller ”dessa/de här”: 8 729G43 – Artificiell Intelligens Projektarbete Frida Engslätt frien722 FILM: Den här filmen spelades in i Linköping 1952 med Stellan Skarsgård som huvudroll. - “Denna/detta/den här/det här” eller “dessa/de här” som ett pronomen: JUL: År 2012 utsågs den här till årets julklapp. - När hela frågan är en substantiv fras blir hela frågan fokus: MUSIK: Antal plattor som Green Day har släppt det senaste decenniet. - Ett av pronomen ”han/hon/hans/hennes/honom/hennes”: POLITIK: Han blev utsedd till Sveriges statsminister år 2010. - Ett av pronomen “det/de/dem/dess/deras”: NATURKATASTROFER: Det var anledningen till katastrofen i Thailand år 2004. - Pronomenet “en/sådan”: KULTUR: Pippi Långstrump, genombrott år 1950, är en envis sådan. Om ingen av ovanstående regler stämmer in, så antar man att det inte finns något specifikt fokus i ledtråden. (Lally, et al., 2012) LAT LAT står för Lexical Answer Types och innebär ett begrepp/ord i ledtråden som berättar vilken typ av ord som efterfrågas. Grundprincipen för att hitta en LAT i ledtråden beror på upptäckten av fokus och att välja huvudordet till det fokus som valts ut som det enda LAT i meningen. Det finns dock vissa undantag, vilka är följande, med fokus skrivna i kursiv och LATs skrivna med fet stil: - Om fokus är en konjunktion, så är konjunktionerna meningens LATs: Denna film och musikal bygger på samma manus - ”<Fokus> av X”, X är meningens LAT när <Fokus> är något av en/namn/typ/sort: Man bränner sig på denna typ av blomma. - ”<Fokus> åt/till/för X”, X är LAT när <Fokus> är något av namn/ord/term: 9 729G43 – Artificiell Intelligens Projektarbete Frida Engslätt frien722 Detta är ett annat ord för dräpa. - Om inget fokus har hittats i ledtråden och kategorin är en substantiv fras, ta ut huvudordet i kategorin som LAT: LAND: New York, San Fransisco, Las Vegas (Lally, et al., 2012) Några av de mest förekommande LATs, baserat på tidigare Jeopardy! tävlingar, är: han, land, stad, man (Gopinathan, Pradeep; Kutsenko, Vera; Staehle, Joseph). Undantag och svårigheter i upptäckandet av LATs Reglerna som används för att identifiera LATs fungerar i de flesta fall men ibland sker misstag, exempelvis att systemet väljer fel pronomen eller fokus, vilket påverkar valet av LATs. Det händer även att användbara LATs inte upptäcks, så kallad ”falsk negativ”. Motsatsen till dessa är ”falsk positiv”, vilket är ord/begrepp i frågan som identifieras som LATs trots att de inte är det. Det är dessutom svårt för Watson att avgöra huruvida meningens LAT består av ett eller flera ord. Oftast är det ett ord, men i vissa fall, som i exemplet ”den här vice presidenten”, kan inte ”presidenten” extraheras från ”vice”, eftersom det ger en förklaring av vilken slags president frågan syftar på. I dessa fall är det alltså hela termen som utgör frågans LAT. Det är svårare för Watson att upptäcka en sådan sak än vad det är för en människa. I ett exempel från tävlingen var frågans LAT: ”lead singer”, där Watson enbart upptäckte ordet ”singer” som LAT. Dock blir detta problem inte lika stort på svenska som på engelska, eftersom svensk grammatik inte innehåller lika många särskrivningar som engelsk grammatik. En annan svårighet när man ska identifiera LATs är när de finns inuti frågans kategori. Tre villkor kan då användas för att se hur stor sannolikhet det är att ett ord eller en fras i kategorin är LAT, om ordet/frasen uppfyller alla tre villkor är sannolikheten stor. - Ordet/frasen refererar till typ av enhet istället för enheten i sig, exempelvis lakrits istället för godis - Enhetstypen är konsistent med frågans LATs (om det finns något) - Enhetstypen nämns inte i frågan För att undvika ovanstående misstag och den osäkerhet som följer med grundreglerna, använder Watson en klassificerare för att se hur stor sannolikhet det är att en upptäckt LAT verkligen är en LAT. Klassificeraren använder bland annat samma regler som använts för att 10 729G43 – Artificiell Intelligens Projektarbete Frida Engslätt frien722 upptäcka fokus och LATs, tillsammans med andra egenskaper som är inbyggda i ESG och PAS. Om sannolikheten är liten att ett visst ord utgör frågans LAT filtreras det ordet bort för att undvika misstag och öka noggrannheten. Watson lär sig under tävlingens gång och av sina misstag. Statistik på Jeopardy!-frågor genom tiderna visar att sannolikheten att en kategori är en LAT två gånger är stor. Watson utnyttjar det genom att identifiera de fel som görs och dra nytta av dessa i senare frågor. Exempelvis om Watson missar att en kategori är LAT i en fråga, lär sig systemet det och har där med större chans att klara samma typ av fråga nästa gång. Undersökningar har gjorts för att jämföra grundreglerna i ESG och PAS med de regler som implementerats i IBMs Watson efter ovanstående förbättringar. Resultatet från undersökningarna visar bland annat att förbättringarna bidragit till att Watson i 6.5% av frågorna upptäcker LATs som inte upptäcktes enbart med grundreglerna (Lally, et al., 2012). QClasses Jeopardy! innehåller en bred variation av frågor. Question Classifications (QClasses) används för att hjälpa Watson att förstå vilket typ av svar som förväntas, när fokus och LATs misslyckas. Detta sker genom att undersöka vilken typ av fråga det är som har ställts. (Lally, et al., 2012) Typen av klassifikationer i QClasses kan variera beroende på vilket sammanhang de förekommer i. (Li & Roth) I Jeopardy! är några exempel på frågetyper VERB, ÖVERSÄTTNING, MULTIPLE-CHOICE, DATUM och BAND. För att Watson ska hitta vilken typ av fråga som har ställts används två tekniker, reguljära uttryck över texten och syntaktiska regler i PAS. PUSSEL, BAND, MULTIPLECHOICE och FITB identifieras genom reguljära uttryck, medan alla andra frågetyper identifieras genom syntaktiska regler. De olika teknikerna är oberoende av varandra, vilket gör att en specifik fråga kan identifieras till flera olika QClasses. Vissa frågetyper går dock inte att kombinera och för att undvika att de ändå paras ihop används en QClassConsolidator som ser till att det inte sker. Nedan följer alla olika frågetyper i Jeopardy!: - PUSSLE är en frågetyp där svaret kräver ursprung, syntes eller inferens - BAND är när svaret är något som två enheter har gemensamt - MULTIPLE-CHOICE består av, vanligtvis tre, svarsalternativ, där ett av dem är det rätta svaret - FITB (Fill-in-the-blanket) frågar efter ett ord som fyller upp ett tomrum i ledtråden och gör den fullständig 11 729G43 – Artificiell Intelligens Projektarbete Frida Engslätt frien722 - VERB är frågor där svaret är ett verb - ETYMOLOGI söker efter ett ord vars ursprung är från ett annat land - DATUM är när svaret är ett datum eller ett år - NUMMER är när svaret är ett nummer - ÖVERSÄTTNING är frågor där svaret är en fras eller ett ord översatt från ett språk till ett annat - DEFINITION en fråga som innehåller en definition av svaret - KATEGORI-RELATION är frågor där svaret har en semantisk relation till frågan och relationen är angiven i kategorin - FÖRKORTNING är när svaret är en förlängning av förkortningen som anges i frågan De vanligaste frågetyperna i Jeopardy! är DEFINITION och CATEGORY-RELATION. (Lally, et al., 2012) QSections QSections är delar av en fråga som identifieras då den tycks innehålla en speciell handling eller information. QSections kan även användas för att dela upp en fråga i delfrågor, där varje delfråga kan leda till rätt svar. QClasses och QSections påminner om varandra och båda identifieras antingen genom syntaktiska regler i PAS eller genom reguljära uttryck i frågan. Ibland beror QClasses och QSections existens på varandra, vilket gör att dess output då består av samma information. Det finns många olika typer av QSections, där de viktigaste nämns nedan: - Lexikal begränsning visar på begränsningar i svarets syntax genom att exempelvis säga ”en mening på fem ord...” - Förkortningar är en del i en fråga som är en förkortning, vars förlängning är svaret på frågan - Delfrågor är när en fråga kan bli uppdelad i två eller fler delar, där varje delfråga bidrar till att hitta rätt svar - McAnswer är de olika svarsalternativ som utgör en multiple-choice fråga - FITB är den text som omger det tomrum som ska fyllas i frågan (Lally, et al., 2012) 12 729G43 – Artificiell Intelligens Projektarbete Frida Engslätt frien722 Diskussion Jag tycker att de framsteg som gjorts genom utvecklingen av Watson är intressanta och skapar intresse inför framtiden, då QA-system blir viktigare och viktigare i dagens samhälle. Eftersom det mesta numera styrs via tekniska system, så som datorer och internet, är det viktigt för användaren att, lika snabbt som det finns möjlighet att hitta information och tjänster, även kunna få svar på de frågor som uppstår vid användandet av systemen. Dessutom är en förutsättning för systemen att användaren snabbt och smärtfritt kan söka efter information genom att fråga sig fram, istället för att behöva leta sig runt i all befintlig data. Att då kunna ha ett system som kan svara på sådana frågor, trots att de består av naturligt språk och ställs utav människor, är viktigt för att systemen ska bli så hållbara som möjligt. Idag finns exempelvis Eniro, som är en fråga-svara tjänst där människor kan fråga vad som helst, men som även bemannas av människor. Jag tänker mig att liknande system ska kunna bemannas av intelligenta agenter i framtiden som, på samma sätt som Watson förstår frågor i Jeopardy!, förstår de frågor som ställs av systemets användare och kan besvara dessa korrekt. Liknande system börjar komma mer och mer, ett exempel är Siri som är en applikation till Apples iPhones och iPads. Siri försöker svara på de frågor som användaren ställer, men det finns ännu många brister med Siri och det är mer ofta än sällan som Siri missuppfattar frågan och svarar på någonting helt annat. Det finns som sagt vissa brister i IBM Watsons QA-system, vilka redan tagits upp och diskuterats en del ovan. I framtiden kommer system som Watson förmodligen kunna hantera dessa problem ännu bättre, genom att exempelvis ha bredare och mer hållbara regler för semantiken och syntaxen i ett system. Det skulle reducera misstagen och osäkerheten hos systemen. Reglerna kommer förmodligen att bli bättre genom att textanalyser så som ESG och PAS utvecklas i takt med tekniska system, vilket i sin tur leder till förbättringar hos intelligenta agenter. Att låta den intelligenta agenten lära sig genom tidigare erfarenheter, vilket Watson till viss del gör, tror jag är en användbar lösning. Det gör att agenten hela tiden utvecklas och fyller på sin information, utan att det krävs uppkoppling till yttre kunskapsbaser. DeepQA-arkitekturen är inte specifik för Jeopardy! och IBM Watson, utan används även i andra områden. Bland annat håller DeepQA på att utforskas inom arbetsområden så som spel 13 729G43 – Artificiell Intelligens Projektarbete Frida Engslätt frien722 och medicin. Inom sjukvården är förhoppningen att kunna bygga Watson 2.0, som istället för att enbart svara på specifika frågor ska kunna analysera större problemscenarion. Detta ska ske genom en interaktion med användaren, där Watson 2.0, precis som Watson i Jeopardy!, lär sig av tidigare händelser. Watson 2.0 kan exempelvis kontrollfråga när han inte riktigt förstår innebörden i en mening, för att vara säker på att tolkningen av input är korrekt. På så sätt får systemet hela tiden ny information som kan hjälpa till i analysen av senare problemscenarion och input. Med hjälp av Watson 2.0 ska olika alternativ till beslut inom sjukvården, så som medicinering eller diagnostisering, presenteras och analyseras. (Ferrucci D. A., 2011) Jag tror detta kommer bidra till enorma framsteg, såväl inom artificiell intelligens som sjukvården, då det förmodligen öppnar upp för nya intressanta idéer och möjligheter. Samtidigt kommer Watson 2.0 förhoppningsvis hjälpa till att minska på arbetsbördan och ansvaret som i dagsläget läggs på de ansvariga inom sjukvården och bli ett bidragande substitut till sjukvårdarnas kognitiva resurser då dessa inte räcker till. Det är dock viktigt att ha i åtanke att system så som Watson förmodligen aldrig kommer kunna ersätta människans förmågor helt, utan snarare ska användas som ett hjälpmedel. Om mänskliga sjukvårdare litar för mycket på Watson 2.0 finns risken att de tillslut antar att Watson 2.0 säger rätt, utan att försäkra sig om detta. Det skulle kunna skapa risker och misstag som, inom sjukvården, kan ha förödande effekter. 14 729G43 – Artificiell Intelligens Projektarbete Frida Engslätt frien722 Referenser Ferrucci, D. A. (2011). Introduction to "This is Watson". Ferrucci, D., Brown , E., Chu-Carrol, J., & Fan, J. (2010). Building Watson: An Overviev of the DeepQA Project. AI Magazine. High, R. (2012). The Era of Cognitive Systems: An Inside Look at IBM Watson and How it Works. Internal Technical Support Organization. Lally, A., Prager, J. M., McCord, M. C., Boguraev, B. K., Patwardhan, S., Fan, J., . . . ChuCarroll, J. (2012). Question analysis: How Watson reads a clue. Li, X., & Roth, D. (u.d.). Learning Question Classifiers*. Department of Computer Science University of Illinois Urbana-Champaign. Vita, L., Ittycheriah, A., Roukos, S., & Kambhatla, N. (2003). tRuEcasIng. Sapporo, Japan. 15