Gevoelige informatie landelijk darmonderzoek betrouwbaar herkend

Nieuws
Paarse envelop RIVM

Het Rijksinstituut voor Volksgezondheid en Milieuhygiëne (R.I.V.M.) is sinds dit jaar actief bezig met het automatiseren van de gegevens van het bevolkingsonderzoek naar darmkanker. Een belangrijke stap in een proces waarbij snelheid en accuratesse heel belangrijk zijn voor de waardebepaling van de gegevens. Samen met partners MagSoft en Topicus heeft het R.I.V.M. niet alleen een 100% garantie op juistheid van de verwerkte gegevens, maar ook is de doorlooptijd om die betrouwbaarheid te bereiken, geminimaliseerd. Doelstelling is vele levens te redden door vroegtijdige ontdekking van darmkanker.

Het project Bevolkingsonderzoek Darmkanker is niet over een nacht ijs gegaan. Het R.I.V.M. heeft al in 2011 de eerste stappen gezet door een zogenaamde ‘request for information’ uit te zetten in de markt. Dat resulteerde uiteindelijk in 2012 in een ‘request for proposal’ (proeve van bekwaamheid en prijsindicatie) aan vijf partijen.

Projectleider namens R.I.V.M. werd Christiaan Mast van Topicus (een automatiseringsdienstverlener en hoofdaannemer van het project). ‘Het project Bevolkingsonderzoek Darmkanker houdt in dat onder alle mannen en vrouwen van 55 jaar en ouder, om het jaar een darmonderzoek gaat plaatsvinden met als doel, het aantal gevallen darmkanker met verkeerde afloop drastisch terug te brengen. Darmkanker wordt veroorzaakt door een bepaald poliepje en de aanwezigheid van dat poliepje kun je ontdekken door bloed in de ontlasting. Als er nog maar minuscuul kleine sporen van bloed aanwezig zijn, is het al te vinden als je de ontlasting onderzoekt in een laboratorium.

Vanuit het Ministerie van Volksgezondheid is het initiatief genomen om jaarlijks (een deel van) de doelgroep, van de in potentie 4 miljoen gegadigden, te onderzoeken. Per jaar gaat het daarbij om ca. 2 miljoen mensen. Het jaar daarop worden dan de andere 2 miljoen mensen onderzocht en het jaar daar weer na is dan de eerste groep weer aan de beurt.’

Hele operatie

Dat is nog een hele operatie. Alle gegadigden krijgen een brief met een uitnodiging om deel te nemen en een pakketje om hun ontlastingsmonster in op te vangen en terug te sturen, met de ingevulde formulieren. Mast: ‘Dat is een heel kritisch proces in doorlooptijd. Als het monster eenmaal is opgevangen in het buisje, moet het binnen tien dagen worden onderzocht in het laboratorium. Anders geeft de test geen betrouwbare uitslag meer. Het is dus zaak om niet alleen de mensen ervan te overtuigen om hun monster snel in te leveren als ze het eenmaal in het buisje hebben opgevangen, maar ook om de gegevens die op de formulieren moeten worden ingevuld, snel te verwerken. Want die gegevens mét de laboratoriumuitslag zijn onlosmakelijk met elkaar verbonden.’
Het allerbelangrijkste zijn de tijd en datum waarop het monster is genomen. Vanaf dat moment gaat namelijk de klok lopen. Mast: ‘Dat gegeven is cruciaal voor het doorloopproces en de betrouwbaarheid van de laboratoriumuitslag later. Duurt het te lang voordat het monster bij het laboratorium is, dan vind je geen bloedsporen meer. Maar dan zou het toch zo kunnen zijn dat de betrokkene wel die sporen in de ontlasting heeft gehad. Die persoon zou dan onterecht ‘schoon’ worden verklaard en dat kan heel vervelende consequenties hebben.’

Herkenning van handgeschreven informatie

Om al die formulieren handmatig door te lopen is geen optie. Mast: ‘De bedoeling was vanaf het begin om daar intelligente herkenningstechnieken voor te gebruiken. Maar dan nog is het een lastige klus, want het gaat vooral om handgeschreven informatie. De verschillende onderdelen op het formulier moeten door de cliënt worden ingevuld, dan wel worden aangestreept. Naast de NAW-gegevens zijn dat bijvoorbeeld vragen als: wilt u meedoen aan het onderzoek en zo niet, waarom niet en wilt u dan een volgende keer wel mee doen? Het is een kostbare aangelegenheid om dergelijke onderzoeken op zo’n grote schaal te organiseren en te verwerken, dus dan wil je als R.I.V.M. graag een maximaal resultaat. Dat geldt eveneens voor de verwerking van de gegevens. Sommige onderdelen kunnen met een OMR-code herkenning heel snel worden verwerkt. Maar dat geldt niet voor de handgeschreven informatie. En daarbij kan het ook nog gebeuren dat mensen niet goed lezen, de vraag verkeerd interpreteren en daardoor aangevinkte vakjes weer doorstrepen en een nieuwe aanvinken. Dat zorgt allemaal voor vertraging.’

Voor dit specifieke onderdeel, het herkennen van de op de formulieren handmatig ingevulde (ICR) en via aankruisvakjes (OMR) ingevulde informatie, is specialist MagSoft met haar Orion Document Processing software ingezet. Mast: ‘De specifieke problematiek van de handgeschreven informatie vroeg om een specialist die ervaring heeft met dit soort processen en een betrouwbare en alerte partner voor R.I.V.M. kan zijn. MagSoft kwam daarin als beste naar voren.’

Koppelen gegevens

Een deel van de gegevens, zoals de NAW gegevens, komt uit het GBA (Gemeentelijke Basisadministratie van de gemeente waar de cliënt woont). Die gegevens worden met een barcode ook op het buisje voor de ontlasting geplakt, zodat het monster nooit ‘loskomt’ van de man of vrouw die erbij hoort.
Het herkennen van de tijd en datum gebeurt door Orion, de herkenningssoftware van MagSoft. Maarten Boender, directeur MagSoft: ‘Juist het moeilijkst te herkennen gedeelte van de informatie is hier aan een zware deadline gebonden. Bij binnenkomst op de drie laboratoria (Zwolle, Sittard en Rotterdam) moeten de monsters dezelfde dag worden verwerkt. Inclusief de cliëntgegevens met tijd en datum van monstername etc. Uiteindelijk gaat het in de productiefase wel om in totaal 2 miljoen monsters bij een verwachte deelname van 95%, dus dan kun je je geen fouten of tijdverlies veroorloven.

In Rotterdam is de eerste test in de praktijk gedaan en daar hebben we veel van geleerd, waardoor we in de ‘landelijke productiefase’ nog veel effectiever en efficiënter kunnen zijn. Tijdens die eerste testen in de praktijk bleek dat een paar zaken moesten worden aangepast. Bijvoorbeeld de lay-out van het formulier. Bepaalde gegevens worden nu op een andere manier aan de cliënt gevraagd en de software is getraind op de handschriftherkenning. Het streven is om in de productiefase binnen 5 dagen alle gegevens te verwerken. Na die 5 dagen wordt de uitslag al wat onbetrouwbaarder.’

Presentatie Borstkankerbijeenkomst

In productie

De formulieren gaan naar een van de drie laboratoria. Daar worden ze gescand en online aan de Orion-software aangeboden. Orion (in combinatie met de A2iA handschriftherkenning) herkent de handgeschreven informatie en combineert die met de context en validatie van de cliëntgegevens. Vervolgens herkent de software om welke uitnodiging het gaat en interpreteert alle gegevens, inclusief de handtekening op de achterzijde van het formulier. Die gegevens worden daarna via een workflow in Orion gekoppeld aan ColonIS, het centrale systeem waarin alle gegevens inclusief de uitslag worden verwerkt. Per dag kunnen zo de gegevens van ca. 3000 cliënten worden verwerkt. Mast: ‘Om de uitval in het systeem te minimaliseren moet het systeem foutloos werken. Die uitval moeten we namelijk handmatig verwerken en op een aantal van in potentie 2 miljoen deelnemers, is dat een serieus probleem. Nu regelt het systeem nagenoeg alles geautomatiseerd en is de uitval echt heel minimaal. Het gaat daarbij om de ‘fase positives’: de formulieren waarvan de gegevens – vooral de tijd en datum van monstername – die onterecht als ‘goed herkend’ zijn aangeduid. Het kost ons nu nog maximaal een uurtje om die laatste formulieren handmatig te verwerken. Dat zouden we anders nooit voor elkaar hebben gekregen, terwijl we met Orion eigenlijk een ‘light’ oplossing voor een ‘zwaar’ probleem hebben. Per 1 januari 2014 zijn we live met het hele systeem en volledig operationeel om het project Bevolkingsonderzoek Darmkanker met goed resultaat te kunnen starten. In de toekomst kunnen we zo meerdere van deze grootschalige bevolkingsonderzoeken snel en efficiënt afhandelen.’

Plaats een reactie