Användning av terminologi i patientjournaler

Användning av
terminologi i
patientjournaler
Mia Kvist
Inst. för data- och systemvetenskap (DSV),
Stockholms universitet,
och
Centrum för Hälsoinformatik,
Karolinska Institutet
[email protected]
Användning av
termer i
patientjournaler
Mia Kvist
Inst. för data- och systemvetenskap (DSV),
Stockholms universitet,
och
Centrum för Hälsoinformatik,
Karolinska Institutet
[email protected]
Journalspråk
Terminologi - Termer
Jargong
Terminologireformen till svenska
Terminologi i patientjournaler
Fasta fält
Fri text
•
•
•
•
• Ostrukturerat
• Helt vilt språk
• Borde kopplas till
koder?
Strukturerat
Färdiga formuleringar
Är kopplat till koder.
Kan användas för att
skapa statistik.
4
Hypertoni o DM, brtsm och ST lyft anteriort,
PCI mot ockluderad proximal LAD med 2
stent. Cirk stabil.
Hypertoni o DM, brtsm och ST lyft anteriort,
PCI mot ockluderad proximal LAD med 2
stent. Cirk stabil.
Hypertoni o DM, brtsm och ST lyft anteriort,
PCI mot ockluderad proximal LAD med 2
stent. Cirk stabil.
Hypertoni o DM, brtsm och ST lyft anteriort,
PCI mot ockluderad proximal LAD med 2
stent. Cirk stabil.
Hypertoni o DM, brtsm och ST lyft anteriort,
PCI mot ockluderad proximal LAD med 2
stent. Cirk stabil.
Terminologi i patientjournaler
Fasta fält
Fri text
• Strukturerat
• Färdiga formuleringar
• Är/Kan kopplas till
koder.
• Kan användas för att
skapa statistik.
• Kan användas för att
skapa ny text.
• Ostrukturerat
• Helt vilt språk
• Borde kopplas till
koder?
• Borde användas för
att skapa strukturerad
information och
statistik?
10
Proc. 13th Conf. on Artificial Intelligence in Medicine, pp. 348–352.
11
Hypertoni o DM, brtsm och ST lyft anteriort,
PCI mot ockluderad proximal LAD med 2
stent. Cirk stabil.
Rule-based Entity Recognition and Coverage
of SNOMED CT in Swedish Clinical Text
Maria Skeppstedt, Maria Kvist and Hercules Dalianis
LREC2012
Visar hur bra terminologin avspeglar det naturliga
språket i journaler.
Precision
Recall
Kroppsdelar
0.74
0.80
Diagnoser
0.75
0.55
Symtom+fynd
0.57
0.30
• Förkortningar hittades inte med matchning mot terminologier
( 14% av diagnoserna stod i förkortad form)
• Uttryck längre än 2 ord kändes inte igen
13
Machine learning with CRF++
Precision
Recall
Disorder
0.84
0.72
Finding
0.70
0.59
Disorder/Finding
as one group
0.78
0.68
Stockholm EPR Corpus
• Karolinska Universitetssjukhuset
• 600 000 patienter
• 2006-2010
• 900 vårdenheter
• 23 000 författare
Medicinskt journalspråk
Journalstruktur
• Semi-strukturerad text
Grammatik
• Ofullständiga meningar
• Saknar subjekt
• Verbformer
16
Medicinskt journalspråk
Journalstruktur
• Semi-strukturerad text
Grammatik
• Ofullständiga meningar
• Saknar subjekt
• Verbformer
Passiva verb
dubbelt så vanligt i röntgensvar
som i vanlig svenska.
17
Medicinskt journalspråk
Vanlig svenska
Medicinsk terminologi
Medicinsk jargong
18
Medicinskt journalspråk
Vanlig svenska
• Sammansatta ord
strålbehandlingsplaneringsdatortomografi
19
Medicinskt journalspråk
Vanlig svenska
• Sammansatta ord
• Negationer
Inga säkra kliniska hållpunkter för…
Lungemboli kan inte uteslutas.
20
Medicinskt journalspråk
Vanlig svenska
• Sammansatta ord
• Negationer
Använder olika termer vid
affirmerad eller negerad diagnos.
Pat har en fraktur i proximala humerus.
Ingen skelettskada påvisas.
50
Annotations
40
ischemia
heart attack
angina pectoris
30
20
10
0
Certainly Probably Possibly Probably Possibly Certainly
Pos
Pos
Pos
Neg
Neg
Neg
Medicinskt journalspråk
Vanlig svenska
• Sammansatta ord
• Negationer
• Läsa mellan raderna
Står på insulin sedan 5 år.
=
Patienten har diabetes mellitus.
Medicinskt journalspråk
Vanlig svenska
Medicinsk terminologi
• latin, grekiska, engelska
• förkortningar
Medicinsk jargong
24
Förkortningar akutjournal
Autentisk journal:
Pat med bruten hö arm. Rtgjour tar över.
EKG för säkerhets skull. I övrigt u a.
25
Abbreviations X-ray
All words sentences
18
12
bigram
38
trigram
29
18 of the top 100 words were abbreviated
• 7 common abbreviations
(tel = telephone, cm =centimeter),
• 10 domain specific
(iv = intravenous)
• 1 ambiguous
(ca = cancer or circa).
26
Förkortningar
olika termer förkortas i olika specialiteter
VAD FÖRKORTNINGARNA HANDLADE OM
Vanliga svenska förkortningar
Diagnoser
medicinering
provtagning
storlek
metod/procedur
kroppsdelar/position
administration
titlar/yrken
"pat"
Med Akuten (12%)
10
5
12
12
1
9
2
13
6
23
RTG (7%)
13
1
0
0
15
22
10
12
4
0,5
27
Medicinskt journalspråk
Vanlig svenska
Medicinsk terminologi
Medicinsk jargong
• ekonomiskt språk
• udda verbformer
28
Medicinsk jargong
Jargong:
Pat infarcerar på akuten,
t. HIA med mellanjouren.
Vanlig svenska:
Patienten utvecklar en hjärtinfarkt
under tiden på akutvårdsmottagningen,
varför han skyndsamt förflyttas till
Hjärtintensiven av den jourhavande
specialistläkaren.
29
Medicinskt journalspråk
Septisk pat, oklart fokus,
rundodlas före Zinacef.
Patienten har sepsis med oklart ursprung,
bakterieodling tas från samtliga möjliga
infektionsfokus, inklusive blododling,
innan behandling med Zinacef inleds.
Varför jargong?
•Produktionsvillkor.
Ingen tid att fundera på syftningsregler.
Semantisk ekonomi.
•Vem man ser som mottagare av texten.
Skriver för kollegor införstådda med syftet med
texten samt produktionsvillkoren.
•Identitet.
Insocialiseringsprocess
Medicinskt journalspråk
Funktion:
ekonomiskt,
effektivt och
exakt arbetsredskap.
32
Stava med c eller k?
Cholecystitis -> kolecystit
DAY
RTG
kolecystit
48
84
colecystit
1
8
cholecystit
88
1613
DAY – 0,1 milj daganteckningar, 4 milj ord
RTG – 0,43 milj röntgensvar, 20 milj ord
33
Stava med c eller k?
DAY
RTG
DAY RTG
kolit
55
89
colit
57
273
koloncancer
23
3
coloncancer
39
76
kardiell
150
26
cardiell
15
28
kardiellt
94
56
cardiellt
12
6
supraklavikulär 1
7
supraclavikulär 0
5
supraklavikulärt 11
283
supraclavikulärt 4
302
34
DAY
esofagus
oesofagus
oesophagus
esophagus
torax
thorax
pharynx
farynx
RTG
176
4
7
21
1339
35
77
243
13
230
1377
13784
0
4
10
46
35
FRÅGOR?
36