Menu

Machine learning & deep learning voor classificatie van reageerbuizen‌

‌Een interview met Marya Butt, PhD., Onderzoeker Data Driven Smart Society (DDSS), BIG DATA, Computer Vision, Machine Learning bij de faculteit ‘Engineering Design and Computing’ van Inholland. Marya werkt onder andere aan TechValley onderzoekscases met betrekking tot machine learning en deep learning. Een van de cases die ze op zich nam is het ‘classificeren van reageerbuisjes’ in opdracht van RR Mechatronics.

Casus van RR Mechatronics
RR Mechatronics, partner van TechValley, richt zich op meetapparatuur voor bloedonderzoek. Deze apparatuur is bedoeld voor verschillende soorten bloedonderzoekbuizen met verschillende maten en capaciteiten (bijv. 4 ml, 6 ml, 9 ml enz.), afkomstig van veel verschillende fabrikanten. Er was behoefte aan een classifier (software die afbeeldingen in verschillende groepen kan indelen) die in staat is om de reageerbuis te identificeren, zodat de apparatuur de buisjes correct kan ‘herkennen’ en automatisch naar de juiste apparaat in het laboratorium kan sturen.

Het probleem was om alle reageerbuizen in klassen te verdelen. Op basis van de naam die op de reageerbuizen stond, werden ze aanvankelijk gegroepeerd in acht klassen. Er werden twee onderzoeksvragen geformuleerd: het eerste vraagstuk richtte zich op het ontwikkelen van een classificator met meerdere klassen, en het tweede vraagstuk ging om het identificeren van de reageerbuisjes, aan de hand van kenmerken als het logo op de buis, de grootte van de reageerbuis, de kleur en vorm van de dop. Omdat bij de bloed afname er een meer of minder grote sticker op de buis wordt geplaatst, zijn de kenmerken vaak niet allemaal goed zichtbaar.

‌Learning by doing, machine learning en deep learning
Hoe leer je een computer om buizen te herkennen? Vroeger was de aanpak om als programmeur eersten diep na te denken en alle mogelijke eigenschappen op een rijtje te zetten. Vervolgens met “ALS … DAN…” regels tot een oordeel te komen. Tegenwoordig proberen we dat diepe nadenken ook aan de computer over te laten (deep learning). Met een serie afbeeldingen waarvan bekend is in welke klassen ze horen te vallen (de training set), traint de computer zichzelf. Hoe goed dat trainen geluk is wordt vervolgens getoetst met een test set. De aandacht van de programmeur is verlegd naar het kiezen, afstellen en controleren van zelf-lerende algoritmen. Hoe groter de training-set hoe beter de computer het onderscheid kan vinden.
Voor het eerste probleem werden machine learning-algoritmen toegepast en deze hielpen om een redelijk goede nauwkeurigheid te bereiken.

Voor het tweede probleem werd een deep learning-techniek gebruikt en werd een nauwkeurigheid van meer dan 80% bereikt om de labels van de reageerbuisjes te identificeren. Learning by doing, door de computer wel te verstaan en niet de programmeur.

Vervolgexperimenten nodig
Dit onderzoek is nog niet afgerond. De criteria voor het groeperen van reageerbuisjes zijn scherper gesteld. Een onderzoeksvraag voor vervolgonderzoek is een methode vinden om vast te stellen of de reageerbuis voldoende bloed bevat. Wanneer de bloedspiegel lager is dan 1,7 ml, moet deze bijvoorbeeld worden geclassificeerd als "niet bruikbaar voor meten van de bloed bezinking".‌
Walter van Geel
Programmamanager‌
Edith Helsdingen
Projectondersteuner
José Laan
Projectleider
Sandra Verweij
Projectleider
Ontwikkelingsbedrijf Noord-Holland Noord
‌Bergerweg 200
‌1817 MN Alkmaar‌
072 519 57 74
info@nhn.nl