Zusammenfassung
- Erforscht KI-Ethik mit Emma McGrattan und Chirag Mehta.
- Untersucht globale Vorschriften und Anforderungen an die Transparenz von KI.
- Befasst sich mit Herausforderungen beim Datenzugriff und der Auffindbarkeit.
- Analysiert synthetische Daten im Training.
Kapitel
Was halten Sie von der ethischen Nutzung von KI in Bezug auf Training und den Einsatz von Modellen in der Praxis? Denn es beunruhigt mich, dass in bestimmten Regionen KI möglicherweise völlig unkontrolliert eingesetzt wird, während man in anderen Regionen vorerst zurückhaltend ist, bis man sie besser versteht. Was haben Sie darüber gehört?
Sie möchten gegenüber Ihren Kunden und anderen Interessengruppen hundertprozentige Transparenz darüber walten lassen, was bei der Entwicklung dieses KI-Artefakts eine Rolle gespielt hat. Und dann gibt es noch andere Aspekte der verantwortungsvollen KI, die eher nachgelagert sind, nämlich: Wofür möchten Sie KI einsetzen?
Diese ethischen Überlegungen sind sehr wichtig, damit diejenigen, die tatsächlich ein KI-System entwickeln, über Daten nachdenken, die tatsächlich Teil dieses Systems werden und für eine Vielzahl von Zwecken verwendet werden können. Insbesondere auf der Seite Training sind alle öffentlichen Datensätze so gut wie verschwunden. Der einzige Datensatz, auf den Sie Zugriff haben werden, ist also Ihr eigener Datensatz.
Aber wissen Sie was? Ihre eigenen Daten befinden sich nicht am richtigen Ort und sind nicht auffindbar. Die Auffindbarkeit ist also ein viel größeres Problem.
Und ich glaube, die Leute stellen nicht unbedingt eine Verbindung her zwischen verantwortungsvoller KI und der Suche nach Daten. Was ist mit der Generierung von Daten für Training ? Das können Sie, solange Sie sich darüber im Klaren sind, was diese synthetischen Daten sind.
Synthetische Daten sorgen dafür, dass bestimmte Modelle schneller laufen, und wir haben gesehen, dass synthetische Daten nicht nur für Training, sondern auch für die Inferenz verwendet werden.
Synthetische Daten haben also ihre Berechtigung, aber sie sind kein Ersatz für echte Daten, oder? Nein, da stimme ich zu. Daten sind chaotisch, nicht wahr?
Und synthetische Daten sind sauber, weil Sie sie gerade für den bestimmten Zweck erstellt haben, den Sie im Sinn haben. Wenn Sie also in die Praxis gehen, werden sie nicht repräsentativ für das sein, was wir vorfinden werden.