Zusammenfassung
Die Erfolge von Faltungsnetzwerken (Convolutional Neural Networks, CNNs) in der Bildverarbeitung haben in den letzten Jahren große Aufmerksamkeit erregt. Die Erforschung von Verfahren zur Klassifikation von Mimik auf Bildern menschlicher Gesichter stellt in der Medizin eine große Chance für Menschen mit körperlicher Behinderung dar. So können beispielsweise einfach Befehle an einen elektronischen Rollstuhl oder ein Computerprogramm übermittelt werden. Diese Arbeit untersucht, ob und wie weit die Verwendung von Zusatzinformation (hier in Form von Segmentierungen von Gesichtspartien) beim Training eines CNN-Klassifikators die Genauigkeit bezüglich der Entscheidung für verschiedene Kiefer- und Lippenstellungen verbessern kann. Unsere Ergebnisse zeigen, dass die Genauigkeit des CNN-Klassifikators mit dem Detailgrad der verwendeten Segmentierungen zunimmt und außerdem bei Zuhilfenahme von Segmentierungen ein deutlich kleinerer Datensatz (60% der ursprünglichen Datenmenge) ausreicht, um ein ähnlich genaues CNN (im Vgl. zu einem ohne Zusantzinformation) zu trainieren.
Access this chapter
Tax calculation will be finalised at checkout
Purchases are for personal use only
Preview
Unable to display preview. Download preview PDF.
Similar content being viewed by others
Literatur
Ju JS, Shin Y, Kim EY. Vision based interface system for hands free control of an intelligent wheelchair. J Neuroeng Rehabil. 2009;.
Zhou B, Krähenbühl P, Koltun V. Does computer vision matter for action? arXiv preprint arXiv:190512887. 2019;.
Hasani B, Mahoor MH. Facial expression recognition using enhanced deep 3d convolutional neural networks. In: Proc IEEE comput soc conf comput vis pattern recognit workshops; 2017. p. 2278–2288.
Cho J, Lee K, Shin E, et al. Medical image deep learning with hospital PACS dataset. arXiv preprint arXiv:151106348. 2015;.
He K, Zhang X, Ren S, et al. Deep residual learning for image recognition. In: Proc IEEE comput soc conf comput vis pattern recognit; 2016. p. 770–778.
Ronneberger O, Fischer P, Brox T. U-Net: convolutional networks for biomedical image segmentation. In: Med Image Comput Comput Assist Interv; 2015. p. 234–241.
Le V, Brandt J, Lin Z, et al. Interactive facial feature localization. In: Proc IEEE Eur Conf Comput Vis; 2012. p. 679–692.
Smith BM, Zhang L, Brandt J, et al. Exemplar-Based face parsing. In: Proc IEEE comput soc conf comput vis pattern recognit; 2013. p. 3484–3491.
Author information
Authors and Affiliations
Corresponding author
Editor information
Editors and Affiliations
Rights and permissions
Copyright information
© 2020 Springer Fachmedien Wiesbaden GmbH, ein Teil von Springer Nature
About this paper
Cite this paper
Keuth, R., Hansen, L., Heinrich, M.P. (2020). Der Einfluss von Segmentierung auf die Genauigkeit eines CNN-Klassifikators zur Mimik-Steuerung. In: Tolxdorff, T., Deserno, T., Handels, H., Maier, A., Maier-Hein, K., Palm, C. (eds) Bildverarbeitung für die Medizin 2020. Informatik aktuell. Springer Vieweg, Wiesbaden. https://doi.org/10.1007/978-3-658-29267-6_66
Download citation
DOI: https://doi.org/10.1007/978-3-658-29267-6_66
Published:
Publisher Name: Springer Vieweg, Wiesbaden
Print ISBN: 978-3-658-29266-9
Online ISBN: 978-3-658-29267-6
eBook Packages: Computer Science and Engineering (German Language)