spm_gl hat geschrieben: Vielleicht sollte ich einen Praktikanten einstellen, der den ganzen Tag Metadaten eintippt
Das halte ich auch für die beste Lösung }:-]
Schließlich ist die Wirkung bei Effekten sehr subtil. Ein Mensch kann sicherlich einige hundert verschiedene Wettergeräusch voneinander unterscheiden. Er/sie hört instinktiv, ob es ein freundlicher Sommerregen, eine Flutkatastrophe oder ein majestätischer Monsun ist. Wenn Du Dir die entsprechenden Wave-Grafen ansiehst, wirst Du sicher auch Unterschiede sehen aber von diesen maschinenlesbaren Unterschieden auf Muster zu kommen, die auf
psychoakustisch wirksame Eigenschaften hinweisen, ist mindestens schwierig. Allerdings könnte man das schaffen, wenn ein Mensch die Maschine trainiert. Wobei dann allerdings wieder persönliche Preferenzen eine Rolle spielen....
Also:
1.) eine Datenbank mit Frontend erlaubt das taggen von Sounds.
2.) eine geeignete Analysesoftware hört sich die Sachen an und denkt darüber nach:
2.1.) Der Sound wird zerlegt und statistisch durchleuchtet (was für Hüllkurven würden passen, Frequenzanteile etc)
2.2.) Eine Liste leicht benutzbarer maschinenlesbarer Eigenschaften wird zusammengestellt.
2.3.) Die Eigenschaften werden mit denen von gleich getaggten Sounds verglichen.
3.) Die Software versucht, dabei auftretende Meinungsverschiedenheiten mit dem Homo Sapiens, der getaggt hat, in wohlwollender Weise zu lösen. Dazu analysiert sie Sounds, deren maschinenlsebaren Eigenschaften nicht zusammenpassen, obwohl sie die gleichen tags tragen, erneut und versucht andere, übereinstimmende Besonderheiten zu finden.
4.) Ein komplexer, mathematischer Mechanismus bildet selbsständig ein vernetztes System von Bewertungen und Eigenschaften, das darauf hinarbeitet, die bei der Analyse erhobenen Daten besser und schneller dem tag-System zuzuordnen.
5.) Nachdem 5-6 sehr sehr sehr, ja, außerordentlich sorgfältige und disziplinierte Tagger tausende von Audiodateien getaggt haben und die Weichware einen Quadcore für einige tausend Stunden mit Vollast beschäftigt hat, bekommt man ein System, das tatsächlich ähnlich smart wie ein guter Spamfilter funktioniert und neuie Audiofiles selber korrekt zu taggen vermag.
Allerdings müssen Spamfilter nur abstrakten Text und keine konkreten Sounds analysieren.
Ach so: einfach wäre es sicherlich, solche Funktionen wie "Zupfinstrument, D-Dur-Dreiklang heraussuchen(und nach FMoll konvertieren)" umzusetzen. Melodyne kann sowas prinzipiell. Aber wir reden ja von Software, die wie ein Mensch hören können soll und nicht von einer, die nur wie ein besseres Stimmgerät hört.
Möglich wäre es aber trotzdem und eventuell arbeiten schon einige Superhirne für ihren PHD daran.