Automatisk litelogianalyse basert på maskinlæringsalgoritmer med utgangspunkt i Naive Bayes Classifier
Master thesis
Permanent lenke
http://hdl.handle.net/11250/137190Utgivelsesdato
2005Metadata
Vis full innførselSamlinger
Sammendrag
Når det skal bores etter olje eller andre mineraler vil det være en fordel å vite noe om grunnen
det skal bores i. Ved hjelp av sensorer som sitter på borestrengen kan man med stor sikkerhet
avgjøre i hvilken litelogi det blir boret. Med en litelogi menes det et fast stoff som for
eksempel Skifer, Sand eller Stein. Når man vet hvilke litelogier grunnen består av, vil
sannsynligheten for å finne olje og mineraler bli avslørt. De målte verdiene cid G fra sensorene
blir lagret i en logg, og loggen blir sendt videre til en geolog som utfører tolkningen av denne.
Ved å utvikle en automatisk loggtolker vil tolkningen av loggene effektiviseres ved at loggene
ikke trengs å sendes til en geolog. En datamaskin vil klassifisere de forskjellige litelogiene
ved hjelp av verdiene i loggen, og litelogien blir analysert fortløpende. Dette vil føre til
hurtigere avgjørelser under boringen som resulterer i tid og kostnadsbesparelse, da det koster
mange tusen kroner per dag å holde en boreplattform operativ.
Et problem med å utvikle en automatisk loggtolker er at sensorene er plaget av støy, noe som
gjør at verdier målt fra samme litelogi varierer. Videre er det et problem at antall sensorer
ikke er fast eller alltid de samme i loggene. Under boringen blir det målt store mengder data
fra sensorene.
På bakgrunn av de overnevnte problemene ble det undersøkt hvilke metoder som ville egne
seg best til å utvikle en loggtolker. Vi valgte å benytte en metode som bygger på
normalfordeling da en normalfordeling tillater variasjoner i verdiene som representerer en
litelogi. Metoden vi valgte å undersøke nærmere var Naive Bayes Classifier. Denne metoden
har fordelen at den tolererer støy i datasettet samtidig som den gir en gradering av
klassifiseringen. Metoden kan også trene opp systemet inkrementelt. Det vil si at det ikke
kreves at alle treningsdataene blir lest inn på en gang, og dataene kan derfor trenes opp over
en lengre tidsperiode. Den benytter flere sensorer til å klassifisere litelogiene som er med på å
redusere feil.
Fire forskjellige logger ble brukt for å teste ut metoden, og loggene ble valgt da de gav et
representativt utvalg av hvordan grunnen kan se ut. Det ble gjennomført en sammenlikning
mellom Naive Bayes Classifier og en klassifisering der én sensor ble benyttet. Det viste seg at
Naive Bayes Classifier klassifiserte loggene bedre i tre av fire tilfeller.
Det er naturlig å tro at det eksisterer en sammenheng mellom etterfølgende målinger. Om
det kan dras nytte av denne korrelasjonen for å gi økt klassifiseringsnøyaktighet ble undersøkt
ved hjelp av Hidden Markov Model. Den har de samme egenskapene som Naive Bayes
Classifier, men i tillegg tar den hensyn til før og etterliggende målinger i tid / rom.
Sammenlikningen mellom Naive Bayes Classifier og Hidden Markov Model, viste at det
fantes en korrelasjon mellom målingene. Hidden Markov Model benyttet seg av denne
korrelasjonen til å klassifisere bedre enn Naive Bayes Classifier i tre av de fire loggene. En undersøkelse om det er mulig å oppnå en bedre klassifisering ved å optimalisere Naive
Bayes Classifier og Hidden Markov Model er blitt utført. Ved å fjerne 1 ‰ av de såkalte
uteliggerne viste det seg at klassifiseringen ble like bra eller bedre i alle fire loggene. Vi fant
ut at alle tilgjengelige sensorer bør benyttes i klassifiseringsmetodene.
Etter flere undersøkelser viste det seg at verdiområdet, som kjennetegner hver litelogi,
forandrer seg avhengig av hvor det blir boret.
Ut fra resultatene i denne rapporten ser det ut til at Hidden Markov Model bør bli benyttet
som klassifiseringsmetode. Alle tilgjengelige sensorer bør benyttes, og 1 ‰ av uteliggerne
bør fjernes. Systemet må trenes opp med data fra samme borehull for å oppnå høyest grad av
riktig klassifisering. Om resultatene ønskes i ”sanntid” mens boringen pågår, vil Naive Bayes
Classifier være et godt alternativ til Hidden Markov Model. Eventuelt kan Hidden Markov
Model konfigurere slik at den tilnærmet klassifiserer i ”sanntid” ved for eksempel å benytte
kun fem etterliggende målinger.
Beskrivelse
Masteroppgave i informasjons- og kommunikasjonsteknologi 2005 - Høgskolen i Agder, Grimstad
Utgiver
Høgskolen i AgderAgder University College