Bayesiskt nätverk

Den här artikeln behöver fler eller bättre källhänvisningar för att kunna verifieras. (2014-01)
Åtgärda genom att lägga till pålitliga källor (gärna som fotnoter). Uppgifter utan källhänvisning kan ifrågasättas och tas bort utan att det behöver diskuteras på diskussionssidan.

Ett bayesiskt nätverk, bayesianskt nätverk eller nät är en grafisk[särskiljning behövs] modell för sannolikhet. Den föreställer en mängd av tillfälliga variabler och deras betingade samband framställda med hjälp av en riktad acyklisk graf (en riktad graf som saknar cykler). Ett sådant nät är uppbyggt av noder, knutpunkter, som är beroende av varandra. Om det finns två noder, A och B, där B är beroende av A, innebär det att A är "förälder" till B. Med hjälp av ett bayesiskt nätverk kan man beräkna sannolikheter för olika utfall, där hänsyn tas till alla faktorer som kan spela in. Exempelvis om föräldranoderna är m {\displaystyle m} boolska variabler, så kan sannolikhetsfunktionen representeras i en tabell av 2 m {\displaystyle 2^{m}} noteringar. Det är en för var och en av de 2 m {\displaystyle 2^{m}} möjliga kombinationerna av föräldranodernas möjlighet att vara sanna eller falska.

Användningsområden finns inom medicin, bildbehandling och beslutsstödsystem, bland annat för skräpposthantering eller textinmatning i mobiltelefon. Fördelar ligger i att en stor mängd data kan behandlas snabbt och kostnadseffektivt.

Definitioner och begrepp

Det finnes flera ekvivalenta definitioner av bayesiska nätverk. För de följande definitionerna låt G = (V,E) vara en riktat acyklisk graf (eng: DAG), och låt X = (Xv)vV vara en mängd av tillfälliga variabler betecknade med V.

Faktoriell definition

X är ett bayesiskt nätverk med hänsyn till G, om deras gemensamma sannolikhets täthetsfunktion kan beskrivas som en produkt av de individuella täthetsfunktionerna, betingat av deras föräldravariabler: [1]

p ( x ) = v V p ( x v | x pa ( v ) ) {\displaystyle p(x)=\prod _{v\in V}p{\big (}x_{v}\,{\big |}\,x_{\operatorname {pa} (v)}{\big )}} ,

där pa(v) är mängden föräldrar till v (t.ex. de toppunkter som pekar direkt till v via en enkel kant).

För en godtycklig mängd av tillfälliga variabler, bräknas sannolikheten av vilket som helst medlem av gemensam fördelning (eng: joint distribution) utifrån betingade sannolikheter genom att använda (eng: chain rule)kedjeregeln som följer:[1]

P ( X 1 = x 1 , , X n = x n ) = v = 1 n P ( X v = x v X v + 1 = x v + 1 , , X n = x n ) {\displaystyle \mathrm {P} (X_{1}=x_{1},\ldots ,X_{n}=x_{n})=\prod _{v=1}^{n}\mathrm {P} (X_{v}=x_{v}\mid X_{v+1}=x_{v+1},\ldots ,X_{n}=x_{n})}

Sammanknytes denna med definitionen ovan, kan det skrivas som:

P ( X 1 = x 1 , , X n = x n ) = v = 1 n P ( X v = x v X j = x j {\displaystyle \mathrm {P} (X_{1}=x_{1},\ldots ,X_{n}=x_{n})=\prod _{v=1}^{n}\mathrm {P} (X_{v}=x_{v}\mid X_{j}=x_{j}} för varje X j {\displaystyle X_{j}\,} , som är en förälder till X v {\displaystyle X_{v}\,}

Skillnaden mellan de två uttryckena är variablenas betingade oberoendet från vilken som helst av deras ikke-efterkommande, givet värdena till deras föräldravariabler.

Lokal Markovegenskap

X är ett bayesiskt nätverk med hänsyn till G, om det uppfyller den lokala Markovegenskapen. Det vill säga att varje variabel är betingat oberoende av dess ikke-efterkommande, givet att dess föräldravariabler följer[2] :

X v X V de ( v ) | X pa ( v ) för alla  v V {\displaystyle X_{v}\perp \!\!\!\perp X_{V\setminus \operatorname {de} (v)}\,|\,X_{\operatorname {pa} (v)}\quad {\text{för alla }}v\in V}

där de(v) är mängden av efterkommande av v.

Detta kan även uttryckas på en form som är maken till den första definitionen:

P ( X v = x v X i = x i {\displaystyle \mathrm {P} (X_{v}=x_{v}\mid X_{i}=x_{i}} för varje X i {\displaystyle X_{i}\,} som inte är en efterkommande till X v ) = P ( X v = x v X j = x j {\displaystyle X_{v}\,)=P(X_{v}=x_{v}\mid X_{j}=x_{j}} för varje X j {\displaystyle X_{j}\,} som är föräldrar till X v ) {\displaystyle X_{v}\,)}

Lägg märke till att mängden av föräldrar är en delmängd av mängden av icke-efterkommande, därför att grafen är acyklisk.

Se även

  • Bayesiansk statistik
  • Masreliez' teorem

Noter och referenser

  1. ^ [a b] Stuart Russel & Peter Norvig (2003): Artificial Intelligence - a modern approach, ISBN 0-13-080302-2, Pearson Education (side 496)
  2. ^ Stuart Russel & Peter Norvig (2003): Artificial Intelligence - a modern approach, ISBN 0-13-080302-2, Pearson Education (sid 499)

Litteratur

  • Ben-Gal, Irad; Ruggeri, Fabrizio; Kennett, Ron S.; Faltin, Frederick W; Encyclopedia of Statistics in Quality and Reliability,  PDF, kap. Bayesian Networks, John Wiley & Sons (2007). ISBN 978-0-470-01861-3
  • Enrique Castillo, Jose Manuel Gutierrez, Ali S. Hadi: Expert Systems and Probabilistic Network Models. Springer-Verlag, New York (1997). ISBN 0-3879-4858-9
  • Dowe, David L.; MML, hybrid Bayesian network graphical models, statistical consistency, invariance and uniqueness, i Handbook of Philosophy of Science (Volume 7: Handbook of Philosophy of Statistics), Elsevier (2010), [1] ISBN 978-0-444-51862-0, sid 901-982, (2010).
  • Fenton, Norman; Neil, Martin E.; Managing Risk in the Modern World: Applications of Bayesian Networks – A Knowledge Transfer Report from the London Mathematical Society and the Knowledge Transfer Network for Industrial Mathematics. Londres (Reino Unido): London Mathematical Society, (November 2007).
  • Finn V. Jensen: Bayesian Networks and Decision Graphs. Springer Science+Business Media-Verlag, New York (2001). ISBN 0-3879-5259-4
  • Richard E. Neapolitan: Learning Bayesian Networks. Prentice Hall (2003). ISBN 0-13-012534-2
  • Judea Pearl: Probabilistic Reasoning in Intelligent Systems: Networks of Plausible Inference. Morgan Kauffmann Publishers, San Francisco (1988). ISBN 0-9346-1373-7
  • Judea Pearl: Causality. Cambridge University Press, Cambridge 2000, ISBN 0-5217-7362-8