Automatisk litelogianalyse basert på maskinlæringsalgoritmer med utgangspunkt i Naive Bayes Classifier

Hauger, Roar; Holene, Nils-Edvard Lileng

Hauger, Roar; Holene, Nils-Edvard Lileng

Master thesis

Åpne

master_ikt_2005_hauger.pdf (726.1Kb)

Permanent lenke

http://hdl.handle.net/11250/137190

Utgivelsesdato

2005

Metadata

Vis full innførsel

Samlinger

Master's theses in Information and Communication Technology [508]

Sammendrag

Når det skal bores etter olje eller andre mineraler vil det være en fordel å vite noe om grunnen

det skal bores i. Ved hjelp av sensorer som sitter på borestrengen kan man med stor sikkerhet

avgjøre i hvilken litelogi det blir boret. Med en litelogi menes det et fast stoff som for

eksempel Skifer, Sand eller Stein. Når man vet hvilke litelogier grunnen består av, vil

sannsynligheten for å finne olje og mineraler bli avslørt. De målte verdiene cid G fra sensorene

blir lagret i en logg, og loggen blir sendt videre til en geolog som utfører tolkningen av denne.

Ved å utvikle en automatisk loggtolker vil tolkningen av loggene effektiviseres ved at loggene

ikke trengs å sendes til en geolog. En datamaskin vil klassifisere de forskjellige litelogiene

ved hjelp av verdiene i loggen, og litelogien blir analysert fortløpende. Dette vil føre til

hurtigere avgjørelser under boringen som resulterer i tid og kostnadsbesparelse, da det koster

mange tusen kroner per dag å holde en boreplattform operativ.

Et problem med å utvikle en automatisk loggtolker er at sensorene er plaget av støy, noe som

gjør at verdier målt fra samme litelogi varierer. Videre er det et problem at antall sensorer

ikke er fast eller alltid de samme i loggene. Under boringen blir det målt store mengder data

fra sensorene.

På bakgrunn av de overnevnte problemene ble det undersøkt hvilke metoder som ville egne

seg best til å utvikle en loggtolker. Vi valgte å benytte en metode som bygger på

normalfordeling da en normalfordeling tillater variasjoner i verdiene som representerer en

litelogi. Metoden vi valgte å undersøke nærmere var Naive Bayes Classifier. Denne metoden

har fordelen at den tolererer støy i datasettet samtidig som den gir en gradering av

klassifiseringen. Metoden kan også trene opp systemet inkrementelt. Det vil si at det ikke

kreves at alle treningsdataene blir lest inn på en gang, og dataene kan derfor trenes opp over

en lengre tidsperiode. Den benytter flere sensorer til å klassifisere litelogiene som er med på å

redusere feil.

Fire forskjellige logger ble brukt for å teste ut metoden, og loggene ble valgt da de gav et

representativt utvalg av hvordan grunnen kan se ut. Det ble gjennomført en sammenlikning

mellom Naive Bayes Classifier og en klassifisering der én sensor ble benyttet. Det viste seg at

Naive Bayes Classifier klassifiserte loggene bedre i tre av fire tilfeller.

Det er naturlig å tro at det eksisterer en sammenheng mellom etterfølgende målinger. Om

det kan dras nytte av denne korrelasjonen for å gi økt klassifiseringsnøyaktighet ble undersøkt

ved hjelp av Hidden Markov Model. Den har de samme egenskapene som Naive Bayes

Classifier, men i tillegg tar den hensyn til før og etterliggende målinger i tid / rom.

Sammenlikningen mellom Naive Bayes Classifier og Hidden Markov Model, viste at det

fantes en korrelasjon mellom målingene. Hidden Markov Model benyttet seg av denne

korrelasjonen til å klassifisere bedre enn Naive Bayes Classifier i tre av de fire loggene. En undersøkelse om det er mulig å oppnå en bedre klassifisering ved å optimalisere Naive

Bayes Classifier og Hidden Markov Model er blitt utført. Ved å fjerne 1 ‰ av de såkalte

uteliggerne viste det seg at klassifiseringen ble like bra eller bedre i alle fire loggene. Vi fant

ut at alle tilgjengelige sensorer bør benyttes i klassifiseringsmetodene.

Etter flere undersøkelser viste det seg at verdiområdet, som kjennetegner hver litelogi,

forandrer seg avhengig av hvor det blir boret.

Ut fra resultatene i denne rapporten ser det ut til at Hidden Markov Model bør bli benyttet

som klassifiseringsmetode. Alle tilgjengelige sensorer bør benyttes, og 1 ‰ av uteliggerne

bør fjernes. Systemet må trenes opp med data fra samme borehull for å oppnå høyest grad av

riktig klassifisering. Om resultatene ønskes i ”sanntid” mens boringen pågår, vil Naive Bayes

Classifier være et godt alternativ til Hidden Markov Model. Eventuelt kan Hidden Markov

Model konfigurere slik at den tilnærmet klassifiserer i ”sanntid” ved for eksempel å benytte

kun fem etterliggende målinger.

Beskrivelse

Masteroppgave i informasjons- og kommunikasjonsteknologi 2005 - Høgskolen i Agder, Grimstad

Utgiver

Høgskolen i Agder
Agder University College