Archiv der Kategorie: IT

Der kleine Maschinenlerningenieur

Am 22. Januar habe ich mit dem Abschlussprojekt für meine „Machine Learning Engineer Nanodegree“-Fortbildung bei Udacity begonnen. Am Dienstag habe ich abgegeben, und am Mittwoch hatte ich bereits die Bestätigung: Passt! Viel Rückmeldung gab es diesmal leider nicht. Für mich sah es so aus, als wäre die begutachtende Person nur mal drüber geflogen. Gerade da ich von vorne bis hinten beim Abschlussprojekt alles selbst gemacht habe, hätte ich mich über Verbesserungsvorschläge und Hinweise auf Wissenslücken jenseits meiner eigenen Erkenntnis gefreut. Schade.

Lernkurven aus einem Projekt zum Maschinenlernen

Eine Visualisierung einiger meiner Ergebnisse

Ich habe nun nachträglich noch ein wenig gefeilt und einen Report als Mischung meiner schriftlichen Ausarbeitung und meines Quelltextes erstellt. Letzterer wäre definitiv noch überarbeitungsbedürftig, aber für Udacity scheint es gereicht zu haben. Falls ihr reinschauen wollt, findet ihr den Report zum Herunterladen und alle weiteren Inhalte wie bereits von Anfang an auf github.

Weiter geht’s übrigens direkt mit dem Kurs „Maschinelles Lernen“ vom Hasso-Plattner-Institut. Und nun habe ich auch wieder Zeit für H5P …

Mein Abschlussprojekt zum Maschinenlernen … Los geht’s!

Nachdem ich Ende letzten Jahres zwei Wochen Urlaub dafür genutzt hatte, um Zeit für die „Machine Learning Engineer“-Fortbildung bei Udacity zu investieren, ging es danach deutlich langsamer voran. Es war schwieriger als gedacht, ein Thema für mein Abschlussprojekt zu finden. Ich hatte ja auch hier etwas dazu geschrieben. Datensätze gibt es im Netz genug, aber ich wollte an etwas arbeiten, was auch jemand gebrauchen könnte.

Tatsächlich hätte ich für OpenSNP an einem Modell arbeiten können, um anhand von Genomdaten die Herkunft einer Person zu bestimmen, aber dafür kenne ich mich dann mit Biologie doch zu wenig aus. Danach hatte ich Kontakt zu jemandem, der die Problemlösungskompetenz von Studierenden untersucht und auch zahlreiche Daten dazu gesammelt hatte. Seinen Artikel habe ich dank Sci-Hub … per Zufall gefunden. Die Daten lagen allerdings unter Verschluss. Closed Science. Ich sollte erst einmal meinen Lebenslauf schicken, vermutlich um zu prüfen, ob da ein böser Konkurrenzforscher seine Arbeit „stehlen“ wolle. Habe ich verschickt, aber danach nie wieder etwas gehört und auch nicht nachgebohrt. So ein Umfeld meide ich doch lieber … Was soll’s.

Analysesoftware auf einem Laptop

Da der Gebührenzähler unerbittlich tickt, habe ich mich dazu entschlossen, doch einfach ein Wald-und-Wiesen-Thema zu nehmen. Ich habe ein paar Datensätze zu Videospielen gefunden und werde versuchen, damit etwas auf die Beine zu stellen. Vielleicht ist es möglich, darauf aufbauend ein Model zu erstellen, mit dem man anhand von Kritiker- und Kundenbewertungen und ein paar anderen Daten die Verkaufszahlen vorhersagen kann. Der von mir eingereichte Vorschlag ist jedenfalls gerade angenommen worden, und ich kann nun loslegen.

Als Nebenprodukt ist außerdem noch eine weitere Projektidee für H5P (und darüber hinaus) entstanden, die allerdings den Rahmen eines Abschlussprojektes sprengen würde. Werde ich im Nachgang angehen. Offen. Mehr dazu gibt es in Kürze.