Archiv der Kategorie: IT

Braucht ihr Unterstützung? Gebt her eure Daten!

Arbeitet ihr mit Daten und braucht kostenlose Arbeitskraft? Dann solltet ihr weiterlesen!

Vor nicht ganz drei Wochen habe ich bei Udacity mit dem Nanodegree-Programm zum „Machine Learning Engineer“ begonnen. Gestern Abend zeigte mir die App dann bereits das Erreichen der 95-Prozent-Marke an. Tatsächlich muss ich nur noch ein Projekt bearbeiten, das ein Thema abschließt. Danach steht schon das finale Projekt an.

Fortschrittsbalken mit 95 %Das tolle an diesem Abschlussprojekt: Ich kann mir Problem und Fragestellung selbst wählen und dann bearbeiten. Das wird das Analysieren passender Daten umfassen, um daraufhin Software zu schreiben, mit deren Hilfe Erkenntnisse gewonnen werden können. Außerdem müssen die Gedankengänge dahinter samt der Ergebnisse in einem Bericht festgehalten werden. Der soll rund 10-15 Seiten umfassen. Ist also im Prinzip so etwas wie eine Seminararbeit an einer Hochschule. Damit man sich vorstellen kann, wie so etwas aussieht, stellt Udacity auch Beispiele bereit.

Ich habe schon ein paar Ideen, was ich machen könnte. Die haben den ein oder anderen Pferdefuß. Manchmal fehlt mir das Wissen zu einem bestimmten Fachgebiet, aus dem die Daten kommen. Manchmal habe ich ethische Bedenken, weil die Datensätze auch in anonymisierter Form mit ein bisschen Aufwand Rückschlüsse auf Einzelpersonen zuließen. Das ist durchaus relevant, weil ich natürlich alles offen erarbeiten und bereitstellen möchte.

Ich hätte da ein Angebot…

Falls ihr mit Daten hantiert und vielleicht gerade nicht die Zeit oder Kenntnisse habt, mit denen weiter zu arbeiten, hätte ich ein Angebot für euch. Ich könnte euch kostenlose Arbeitskraft dafür schenken. Bedingung wäre halt, dass ich neben meinem Bericht und meinem Quelltext auch die Daten offen zur Verfügung stellen dürfte. Das ermöglicht es anderen, meine Ergebnisse bei Bedarf nachzuvollziehen und zu überprüfen. Schließt diverse Dinge vermutlich aus, aber das ist dann halt so.

Falls ihr mehr dazu wissen möchtet oder eine Idee habt, hinterlasst doch einfach einen Kommentar oder meldet euch direkt bei mir. Lasst mich aber nicht zu lange warten. Ich möchte bald loslegen :-D

Halbzeit beim Machine Learning Engineer Nanodegree-Programm

Huzzah, Die Hälfte habe ich hinter mir beim Machine Learning Engineer Nanodegree-Programm von Udacity. Es ist wohl an der Zeit, meine Eindrücke und Erfahrungen mal zu sortieren.

Schon die Hälfte?

Wie ich bereits einmal beschrieben habe, soll das Programm etwa 420 Stunden umfassen. Und wer aufgepasst hat, wird auch mitbekommen haben, dass ich seit Freitag vorvergangener Woche daran sitze. Wofür ist Urlaub sonst da? ;-) Und nun schon Halbzeit? Ja, weil mich das Programm nur nicht ganz 50 Stunden dafür in Beschlag genommen hat. Das einfach auf 100 Stunden hochzurechnen, wage ich zwar noch nicht, aber ich werde wohl locker unter der 420 bleiben. Woran liegt das? An zweierlei Dingen, denke ich.

zu 50 % fertig bei Udacity

Zum einen bringe ich durchaus schon Hintergrundwissen aus der IT-Welt mit. Programmieren kann ich halbwegs anständig, und ein wenig beschäftigt habe ich mich mit dem Thema Maschinenlernen ja ebenfalls schon. Zum anderen bleibt das Nanodegree-Programm oft an der Oberfläche oder setzt nur das voraus, was man in Deutschland in der gymnasialen Oberstufe oder einem frühen Semester eines verwandten Hochschulstudiums mitbekommt: ein bisschen triviale lineare Algebra, ein bisschen Statistik-Grundlagen, und vielleicht schon mal hier oder da ein paar Zeilen Quelltext gebaut.

Wie isses denn so?

Ob man das gut oder schlecht findet, kommt ganz darauf an. Wer die Tiefe eines Hochschulstudiums erwartet, wird vermutlich enttäuscht sein. Wer sich praktisch weiterbilden möchte, ohne ganz auf Theorie zu verzichten, findet das Angebot hingegen vermutlich großartig. Man dürfte nach dem Abschluss kaum ein fertiger „Machine Learning Engineer“ sein, aber zumindest mit eigenen Projekten ein wenig besser starten können.

Was ich auf jeden Fall sehr schätze, sind die Projekte. Jedes Kapitel schließt mit einem solchen ab, in dem Inhalte tatsächlich angewendet werden müssen. Nicht nur muss das Gelernte in Quelltext verwandelt werden — leider meist nur durch das Einfügen einiger weniger Zeilen in ein vorgefertigtes Programm — es gilt auch seine Entscheidungen zu erklären und zu begründen. Ich habe das sehr sorgfältig gemacht und war durchaus einige Stunden damit beschäftigt. Okay, und wie checken die das? Clever!

Udacity hat ein Uber-ähnliches System geschaffen. Statt Lehrende zur Durchsicht der eingereichten Projekte fest anzustellen, wird bloß die Infrastruktur bereitgestellt. Es sieht für mich nach einer Plattform aus, auf der die Projekte eingehen und jede/r mit passenden Vorkenntnissen die Begutachtung übernehmen kann. Dafür gibt es auch etwas Geld. Ich tippe zudem, dass auf der Plattform zu jeder Aufgabe innerhalb des Projektes einige Textbausteine und Beispiele bereitstehen, die man ja nach Antwort verwenden kann. Funktioniert bestens. Die Rückmeldungen kommen wirklich schnell. Bisher habe ich noch nicht länger als zwei Stunden gewartet. Die Rückmeldungen finde ich auch wirklich hilfreich. Wären sie das nicht, könnte ich das steuern. Ich darf nämlich auch die Qualität des Feedbacks bewerten. Wenn es doch etwas Vergleichbares an Hochschulen gäbe…

Und sonst?

Gewöhnungsbedürftig finde ich die extrem kurze Laufzeit der Videos. Da reichen sich manchmal zig 30-Sekunden-Videos und trivialste Quizfragen die Klinke in die Hand. Ist das vielleicht eine kulturelle Sache? In den USA wird ja auch das Fernsehprogramm wohl alle Nase lang von kurze Werbeeinblendungen unterbrochen, was jemanden aus Deutschland wohl auch kirre macht. Ein paar andere Dinge würde ich auch anders machen, aber alles in Allem finde ich das dann doch eine runde Sache.

So. Muss weitermachen. Ich freue mich nämlich schon auf das Abschlussprojekt, dessen Thema und Fragestellung ich mir völlig frei aussuchen kann.

Kehre dein Innerstes heraus mit openSNP

Das Projekt openSNP habe ich in meinem Blog schon einmal am Rande erwähnt und dachte mir: Hey, warum nicht mal etwas ausführlicher? It’s open science, baby!

Was ist denn openSNP?

In einem Satz gesagt – hoffentlich korrekt: Bei openSNP kann jeder seine genetischen Informationen offen zur Verfügung stellen und mit weiteren Informationen anreichern, so dass WissenschaftlerInnen damit ihre Forschung unterstützen können.

Falls ihr mehr wissen möchtet, könnt ihr euch das aber auch in nicht einmal fünf Minuten von erzählen lassen. Mitgründer (und der Mark Zuckerberg der Open Source Genetics ;-) ) Bastian Greshake beschreibt im folgenden Video das Projekt. Der Ton ist leider sehr leise geregelt, weshalb ihr an euren Einstellungen etwas drehen solltet.

Hier klicken, um den Inhalt von YouTube anzuzeigen.
Erfahre mehr in der Datenschutzerklärung von YouTube.

Was kann ich für openSNP tun?

Geld spenden: Es handelt sich um ein reines Freizeitprojekt, aber die Server wollen trotzdem nicht kostenlos arbeiten. Falls ihr jeden Monat etwas Kleingeld übrig habt, könntet ihr das Projekt beispielsweise über Patreon eine kleine Finanzspritze geben.

Daten zum Genotyp teilen: Je mehr Daten openSNP hat, desto wertvoller dürfte die Sammlung sein. Darum wäre es natürlich auch toll, wenn ihr eure Genominformationen dort zur Verfügung stellt. Die kann man beispielsweise über 23andme bekommen. Und ja, man sollte für sich überlegen, ob man a) Dienste wie 23andme in den USA nutzen möchte, und ob man b) seine Daten auch weltweit zur Verfügung stellt. Das kann potenziell auch Konsequenzen für Verwandte haben. Ich war jedenfalls so frei

Daten zum Phänotyp teilen: Die Informationen zu eurem Genotyp allein sind schon gut, aber wenn ihr sie um eure Daten zu eurem Erscheinungsbild (Phänotyp) anreichert. Ich fasse mir da an meine eigene Nase. Ich könnte da mal wieder etwas tun.

Quelltext spenden: Wenn ihr programmiert, könnt ihr natürlich auch helfen, die Software der Plattform zu verbessern. Die ist (natürlich) ebenfalls Open Source. Ihr findet sie auf Github.

Zeit spenden: Alles nichts für euch? Dann bleibt nur eins: Spread the word! Oder fragt einfach bei Bastian mal nach, ob es noch anderes zu tun geben könnte.