Tonverarbeitungstechnikverfügbarkeitsvervollkommnung
Digitaltonverarbeitungssystemtechnik Sprachsignalverarbeitungstechnik Rechnersprachinteraktionsmobilisierung
Gesprächsoptipretationswissensbasifizerung Kommunikationsinfrastrukturvollendung Gedankenassistenzsysteme
Gedankenaufarbeitungsvollautomatisierung Situativinfomanagement Sprachausgabesystemezweckadaptierbarkeitsperfektionierung
Allwissensorganisationsunterstützungsautomatisierung Sprachausgabebeispielmaßentwicklungen
Spracherkennungsdialogsupporttechnik Dialogassistenzprogrammierung Kommunikationskontrollsoftware
Sprachtonsignalverarbeitungssystemtechnik
Die Technik digitaler Tonverarbeitung stellt trotz sehr fortgeschrittener allgemeiner Datenverarbeitungstechnologien
immer noch viele sehr grundlegende Herausforderungen an den Softwaresystementwickler. Dies liegt an den oft kritischen
Rahmenbedingungen zeitlicher Reaktionsschnelligkeitswahrung wie auch an der Aufwändigkeit der Verfahren zu detaillierter
Frequenzspektrumszerlegung. So ist es hier schwierig, zufriedenstellende Gesamtlösungen zu erstellen. Dementsprechend
fehlt es auch an leistungsfähigen Beispielen, wo der direkte Zugriff auf die Audiohardware des Computers reibungslos
funktioniert und gleichzeitig komplexe technische Datenverarbeitungen durchgeführt werden können. Auch die Verwendung
von Komprimierungsverfahren wie auch sehr unterschiedlicher Datenformate für übliche Videotonsequenzen
macht den Umgang damit hier nicht leichter. Bei den bis in
die letzten Jahre verfügbaren Sprachsignalverarbeitungssystemen war die eigentliche Mustererkennungsmaschine fast immer
eine feste geschlossene Einheit, die die nötige Variierung und Verallgemeinerung von Funktionen nicht richtig unterstützte.
Ebenso wird bei der Ausbildung von Kommunikationselektronikspezialisten die eigentliche Toningenieurtechnik ähnlich wie
bei Wirtschaftsmathematikern die volle Programmierung aller Berechnungsverfahren und Strukturinterpretationen
traditionell zu Gunsten bewährter Schematisierungsbeschränktheit und Lehrkulturkonservierung fast vollkommen vernachlässigt.
Computerlinguistikanwendungenumsetzungsspracherkennungsmaschinen
Die Konzeptionserarbeitung zu verschiedenen Arten und Systemen der individuellen Spracherkennung und Verarbeitung von
Musik und Geräuschen mit Analyse, Synthese und Transformation ist ein spannendes Aufgabengebiet und führte schon
zu vielen Ideen und Spezialentwicklungen. Auch wurde angefangen, mit Hilfe von marktüblichen Spracherkennungsmaschinen
und Entwicklerkits Systeme der Sprachfernsteuerung von Rechnern umzusetzen und zu optimieren.
Hierzu wurde zuerst das englischsprachige Speech Recognition SDK von Microsoft verwendet, das eine Reihe von Grundfunktionen mit
Musterprogrammen für solche Aufgaben bietet.
Für die deutsche Sprache wie auch für das Betriebssystem Linux könnten mit ähnlich umfassender Funktionalität
vielleicht auch die Systeme von anderen Herstellerfirmen mit standardisierten Erkennungsfunktionen einen guten Einstieg bieten.
Wichtig ist auch die Suche nach allen möglichen nützlichen
Neuentwicklungen in der automatischen Sprachverarbeitung wie zur Übersetzung
von Texten zwischen Sprachen mit Kontrolle des Ablaufs nach individuellen
Kriterien, etwa zur Aufspürung von persönlichen noch nicht bekannten Satzstrukturen oder Wortverwendungen.
Auch hier ist ein großes Spektrum neuartiger hochinnovativer Automatisierungsserver denkbar.
Audioanalysesoftwareselbsterstellung
Als entscheidender weiterer Schritt zur vollkommenen Autonomisierug und Nutzung aller Möglichkeiten der
Audiodatenkontrolle steht noch die Selbsterstellung neuer Erkennungs- und Transformationsmaschinen an.
Dies ist schwierig, da die üblichen Pakete in diesem Bereich meist nicht im Quellcode vorliegen und auch sonst
keine allzu gründliche Änderung der Kernfunktionen zulassen. Dennoch verbergen sich auch hier
gerade deswegen viele ungeahnte Wege, den Umgang mit allem Audiomaterial entscheidend zu verbessern
und wirklich zu vervollkommnen. Weiter stellt es einen relativ großen Aufwand dar, neu eine Fouriertransformation
zur Spektrumanalyse aufzubauen und hierauf basierend neue Zuordnungen und Klassifizierungen nach Maß
vorzunehmen. Leider hat der Verlust des alten Linuxtestsystems mit dem besten Musterprogramm
zur vollautomatischen Sprachanalyse die Versuche hierzu für längere Zeit zum Stillstand gebracht.
Optimierungsaufgabenspektrumbewältigungsspezialkonzepterealisierung
Ähnlich wie bei der Bildverarbeitung steckt bei dieser Thematik der Teufel im Detail und es sind viele Kleinigkeiten und
Eigenheiten zu beachten bei der automatisierten Anlegung und Weiterreichung von Audiodateien im üblichen Format
wie auch der Speicherverwaltung und der Schnittstellentechnik bei der Arbeit mit Files. Dennoch dürften diese Probleme
nun bald alle behoben sein, so dass auch hier sehr leistungsfähige neue Systeme mit bisher ungekannt komfortablen
und nach Maß konfigurierbaren Interaktionsmöglichkeiten zu erwarten sind.
Die für diesen Bereich verfügbaren Musterprogramme wiesen durchgehend schwere Mängel auf, so
dass nicht ohne weiteres neue Programme mit den notwendigen und gewünschten Fähigkeiten
geschaffen werden konnten. Sollten diese jedoch mit mehr oder weniger umständlichem Aufwand
endgültig aufgearbeitet und behoben werden können, ergäben sich umfangreiche neue Möglichkeiten
der Gestaltung von perfektionierten höchst wahlfreien Transformationsprozessen wie auch Synthesen.
Mobilcomputerinteraktionsfunkkommunikationstechnikbereitstellung
Hier geht es um die Schaffung mobiler Sprachkommunikation oder auch optischer Computerfernbedienung
nach Maß mit beliebig funktionalisierbaren und hochorganisierten
universell einsetzbaren Serverrechnern und vernetzten Prozesskontrollrechnern hin zur
Entwicklung von Systemen zur unbegrenzten sprachbasierten mobilen Interaktion
mit Computern, Automatisierungsservern und hiermit weiter vernetzten Ressourcen.
Bei der Sprachkontrolle von Rechnern ist wichtig, nicht nur durch Tastaturersatz eine neue
ortsunabängigere Bedienung zu ermöglichen, sondern auch individuell beliebige Funktionen
benutzerfreundlich konfigurieren zu können und dafür auch geeignete
Sprachschnittstellen zu schaffen mit leistungsfähigen Adaptionstoolkits, auch was die
weitere Organisation der Rechner betrifft mit Zugriff auf Spezialdaten und Programme.
Deshalb wurde hierfür als Einstieg mit vielen Möglichkeiten der
Weiterentwicklung das entsprechende Development Kit von Microsoft soweit
erweitert, dass mit variabel wählbaren Kommandosätzen Befehle
erteilt werden können und auch diktiert, wobei alles zur Kontrolle
für Sprachausgabe auch sofort bestätigt wird und die Art und
Weise dabei weiter nach Erfordernissen angepaßt werden kann. Ein erster Durchbruch
wurde hier erzielt nach langer Erkundung und ausgiebiger Vorstudie, was es hier
an Systemen schon am Markt gibt und was diese schon leisten können.
Wichtige Aufgabe ist dabei auch noch die Schaffung weiterer Spezialhardware, um
etwa über schnurlose Telefone direkt mit den Schnittstellen des Computers
in Dialog treten zu können oder über ein Netz von Lautsprechern
und Mikrofonen in verschiedenen Teilen eines Hauses permanent Kontakt zum Rechnernetzwerk halten zu können.
Alltagsisolationsabschaffungsstrukturversorgungsvollendung
Optimierung von zeitlicher und räumlicher Totalintegration der Kommunikationsmöglichkeiten,
um durch effiziente Lösung vieler Probleme vor Ort vollkommenste Nutzenpotentiale
zu erschließen und den einzelnen von umständlicher Informationsorganisation
zu entlasten bzw. im Alltag gezielt zu führen mit einer Sensitivität
und Zielsicherheit, die die heutigen physischen Engpässe und Kapazitätsgrenzen
der Interaktionsmöglichkeiten des Menschen sprengt und seine konventionellen
alltäglichen Denkkapazitäten vor allem durch hochorganisierte
dynamische Kommunikationsdenkprozesserweiterungen weit übersteigen und nach Maß
wertvoll ergänzen. Dies kann neben der geordneten Niederlegung und Abrufbereitstellung situativer Sachverhalte
vor allem auch die technisch hochgerüstete und multiadaptierte
systematische Unterstützung im Umgang damit umfassen.
Die bis zuletzt noch sehr eingeschränkten Möglichkeiten auf diesem Gebiet zeigen, was es
alles nützliches zu tun gibt und welch grenzenlose Effizienzpotentiale in diesem Bereich noch stecken.
So ist es erst in den letzten Jahren üblich geworden, moderne Diktiergeräte mit der Möglichkeit zu versehen,
die aufgenommenen Nachrichten unkompliziert direkt auf den Rechner zu überspielen, was demnächst auch
drahtlos möglich sein wird. Ähnlich sieht es mit Spracherkennungssoftware aus. Diese ist bis jetzt auch fast
nur in sehr starren Systemen für spezielle Zwecke allgemein verfügbar, könnte aber bei optimierter und
adaptierbarer Neukombination aller standardisierten Grundfunktionalitäten noch unschätzbare neue Dienste leisten.
Medieninhaltstonauswertungstechnikschaffung
Trotz vieler Ansätze für Spracherkennungssysteme fehlt es hier immer noch stark an ausgereifter Technik
mit universellen Einsatzfunktionalitäten für umfangreichste Tonsequenzauswertungen.
Bei all den vorhandenen Unzulänglichkeiten ist vor allem das Fehlen
ernsthafter Versuche bis heute zur routinemäßigen automatischen Tonanalyse von Medieninhalten
sehr zu bemängeln. Und es sind weiter kaum Bemühungen dafür zu erkennen,
Medieninhalte automatisch zu analysieren, für deren Betrachtung man selbst keine Zeit hat oder deren Verfolgung einem
zu aufwändig und umständlich gemacht wird.
Aufgrund verschiedener Schwierigkeiten ist es relativ aufwändig, Experimente mit Tonaufnahmen und schnellen
Veränderungen von solchen zu machen. So ist Softwaretechnik hierfür fast ausschließlich auf die Arbeit mit Dateien
ausgerichtet und es fehlt an Musterbeispielen zum direkten Abspielen von Tondateien aus dem Arbeitsspeicher.
Dies konnte erst mit Hilfe von Videoverarbeitungsbeispielsoftware genügend ersetzt werden.
So besteht trotz aller Fortschritte in der Digitalinformationstechnik und Toningenieurtechnik weiter ein großer
Nachholbedarf dabei, den Menschen aus sklavischer Unselbstständigkeit und
Missinformationsbeschikanierungsgeschäft zu befreien
hin zur vollen Souveränität und verantwortlichem Umgang bei aller Interpretation und Aufbereitung von Geräuschen.
Gedankenoptimalbehandlungskomfortabilisierung
Ziel ist die komfortable hochfunktionale Gedankenerfassung mit Verarbeitung zur möglichst vollkommenen computergestützten
Weiterentwicklung von Ideen und Gedankensystemen nach allen Regeln der
Ökonomik und Sanierungskunst mit Strukturierung nach Maß hin zu unbeschränkten Supergedächtnissen.
Hierzu dient die Bereitstellung der technischen Grundlagen zur problemlosen Erfassung
jedes Gedankens mit Möglichkeit beliebiger Kontexteinordnung.
Dazu gehört massiv ergänzend weiter die Schaffung von Toolkits und Musterbeispielen des höchstkonstruktiven Umgangs
mit Gedanken mit ständiger Erweiterung der Möglichkeiten, Ideen
und Erkenntnisse kreativ automatisch wie in einem Unternehmen verarbeiten
und für verschiedene Aufgaben nutzen zu können.
Hiermit entstehen immer schlagkräftigerere Organismen zur bewußten und massiv fundierten
Lösung aller möglichen gedanklichen Probleme, etwa organisatorischer
Art zur Forcierung von Kreativaufgaben wie auch für die Schaffung von ganzen
Komplexen und Rechensystemen zur perfektionierten verschärften Lösung
aller möglichen Aufgaben, die ein hochspezifiziertes sonst viele Rahmen sprengendes Denkprofil benötigen.
Besonders wegweisendes Grundbeispiel und kritische Einstiegsaufgabe ist hier der effektive Aufbau der Technik
zur Erfassung allen individuellen Wissens mit Möglichkeiten rechnergestützter Weiterentwicklung und funktionaler Vervollkommung.
Allsituativtexterfassungsmöglichkeitensicherstellung
Auch mit Hilfe von Diktiergerätesystemen und sonstigen mobilen Informationsverteilersystemen
ist die jederzeitige hochkomfortable Erfassung und Optimalbehandlung aller relevanten Gedanken zu ermöglichen,
wo und solange noch nicht ständige Mobilfunkverbindungen zu direktem Computerkontakt zur Verfügung stehen.
Die Bereitstellung von digitalen Diktiergeräten an allen wichtigen Orten wie Auto,
Schlafzimmer und Kleidung, wo kein Computer greifbar ist, ist zwar etwas umständlich, kann aber doch in vielen Situationen eine wichtige Ergänzung und gedankliche Stütze sein, wo sonst wichtige Informationen nicht ausreichend detailliert erfasst werden können.
Dabei ist neben der digitalen Überspielung der Inhalte auf Rechner vor allem auch die möglichst einfache Kontextzuordnung sicherzustellen zur ausreichenden Vernetzung aller Inhalte. Weiter sind spezielle Softwarearchitekturen aufzubauen, um Sprachaufzeichnungen so weitgehend wie möglich automatisch in Text umsetzen zu können mit weiteren Programmierfunktionen.
Leider ist auch allgemein noch allzu viel zu tun, um alle Möglichkeiten der Mobilcomputertechnik bereitzustellen und
optimiert vollenden zu können.
Sprachausgabeleitbeispielmaßentwicklungen
Durch wiederholte Experimente mit Behebung der wichtigsten Probleme konnten erste richtungsweisende Beispiele
für individuelle leicht editierbare und veränderbare Sprachausgabe geschaffen werden.
Leider sind die marktgängigen Sprachausgabesysteme noch immer mit fundamentalen
Mängeln und Grenzen der sachgerechten Adaption an Anwendungserfordernisse behaftet. So war etwa das Standardsystem von
Microsoft bis vor kurzem auf englische Laute und Aussprache fixiert.
Neben solchen einseitigen einengenden Standardisierungen, die oft nur durch umständliche
Behelfserweiterungen entschärft werden können, ist dennoch hin zu unbegrenzten
individuellen Spezialanpassungen mit Interkations- und Kontrollmöglichkeiten sehr wichtig und anzustreben,
solche Systeme von Grund auf schon auf allen Ebenen des Quellcodes an individuelle
Bedürfnisse und Besonderheiten anpassen zu können, da nur hiermit
wirklich eine vollkommen durchschaubare und nachvollziehbare perfekte Ausrichtung
auf die Aufgaben des einzelnen möglich ist. Vervollkommnet werden könnte dies auch noch durch
Nutzung aller Möglichkeiten der elektronischen Stimmensynthese.
Sprachausgabesystemezweckadaptierbarkeitsperfektionierung
Leider sind auch bei geeigneten Funkgeräten und drahtlosen Interaktionsmöglichkeiten weiter große
Mängel an brauchbarem Material wie günstigen Funkmikrofonen festzustellen, so daß es noch als sehr aufwendig erscheint,
für jeden Fall eine technisch aufgereifte Lösung bereitzustellen.
Wichtig ist auch die Bereitstellung von sehr adaptiven Sprachausgabesystemen, wo durch programmierte Prioritätensetzung,
Vokabularauswahl oder Zeitsteuerung eine hochindividuelle und zweckorientierte
Anpassung möglich ist, auch mit Rückweisung und Rückstellung
und Spezialbehandlung von Problemfällen und nicht vorgesehenen Besonderheiten
wie beim Vorlesen von automatisch aktualisierten
Internetseiten oder auch eigener Texte zur zeitlich optimierten Erinnerung.
Dabei wäre auch die Verwendung der eigenen Stimme mit Akzentuierung aller Laute
nach eigenem Geschmack einfach möglich.
Datenmanagementdialogisierungsmöglichkeitenerweiterung
Ein weiteres Spezialgebiet und Schritt der Automatisierung ist die Entwicklung von Techniken, die es ermöglichen,
basierend auf Bildanalysen, beliebige vorliegende Texte direkt auf gewünschte
Weise vorlesen zu lassen oder Zusammenfassungen des aktuellen Zustands einer ausgedehnteren Verarbeitung mit
Zwischenergebnissen. Dies kann bei aufwendigeren Prozessen der Suche, Recherche oder Problemlösung der Fall sein,
wo Aufgaben in sonst schwer zu koordinierbaren Submodulen mit stark situativer Relevanz zu lösen sind.
Auch wenn man selbst nicht alles Zeile für Zeile durchlesen möchte oder kann, könnten solche Systeme eine
gute Ergänzung zur Erweiterung der persönlichen Freiheitsgrade sein, evtl. auch in Verbindung mit akustischer
Bedienung und Sprachsteuerung, wozu auch schon sehr praktikable Möglichkeiten bereitgestellt wurden.
Hierbei ist wichtig, ein breites Instrumentarium zur permanenten optimierten Kontextabgrenzung bereitzustellen,
das etwa beim Navigieren in Dateisystemen erlaubt, beliebige Analysefunktionen schon vorwegzunehmen,
um nur noch und sehr konzentriert das wirklich wesentliche in Dialogen wiedergeben und zur sachproblemorientierten
Weiterverfolgung auch in Menüs anbieten und zur differenzierteren Auswahl und Aufmerksamkeitssteuerungsvariation
präsentieren zu können.
Spracherkennungsdialogsupporttechnik
Mit Entwurf und Optimierung von Dialogabläufen mit Spracherkennungsprogrammen wurde dem
Ziel schon sehr nahegekommen, damit Spracherkennung breit im Alltag anwenden zu können, auch
mit Funkübertragungen und zur beliebigen Computerbedienung.
Verwendet wurde hier das Speech Recognition SDK von Microsoft, das sich zum Einstieg
für eigene Entwicklungen gut eignet und auch nicht allzu viel kostet.
Noch offen ist die Frage, welche Recognition Engine sich als Paket
speziell für deutsche Sprache am besten eignet, da es viele Beispiele gibt, die Teilprogramme
unterstützen, aber meist nicht eine flexible Totalautomation sichergestellt ist.
Oft kann das Problem durch Verwendung entsprechender englischer Phoneme umgangen werden,
was aber für eine saubere Komplettlösung schwierig ist.
Selbst wurde zur Softwareentwicklung zu Demonstrationszwecken, ausgehend von einem wenig komfortablen
Musterprogramm des Tuturials des
Sound Development Kits von Microsoft, ein erweitertes Programm geschaffen, wo auf verschiedene Weise
ein eigenes Vokabular eingebunden werden kann, auf dessen Basis dann Wörter oder Laute erkannt werden.
Auch wird hier das erkannte durch eine Stimme jeweils quittiert oder bei Unzuordenbarkeit eine
Rückweisungsmeldung gesprochen.
Aus Zeitgründen wurde vorerst die entscheidende Erweiterung um eine Fileausgabe, Fileeinlesung und
weitere Funktionen wie Korrekturmöglichkeiten, interaktive Dialogverhaltensänderungen
oder Kommandoauswertungen zurückgestellt, was nun
aber bei Bedarf kein großes Problem mehr darstellt, da inzwischen ähnliche Programmrahmenfunktionalitäten
als Muster für andere Aufgaben wie Texttransformation geschaffen wurden.
Dialogführungshochflexibilisierungslösungen
Ergänzt werden soll die Technik zur möglichst perfekten Dialogführung auch durch
richtig durchdachte und systematisierte Systeme zur Variation und Korrektur von
Gedankenaustauschaktionen in allen Phasen.
Kommunikationskontrollinterpretationsassistenzprogramme
Bei der Schaffung von Lösungen zur Kommunikationskontrolle und zur Konversionsassistenz
wird es sich vor allem um Hilfsfunktionen zur Überprüfung der Konsistenz von
erkanntem wie auch zur Korrektur von Schwierigkeiten handeln. Das ganze soll aber auch
in größere Systeme wie zur Übersetzung und Text- wie auch Kommunikationsoptimierung
integriert werden. Konzepte für spezielle Systementwicklungen hierfür sind unter
anderen Entwicklungsbereichen teilweise schon genauer dargelegt.
Weiter sind hierzu alle möglichen technischen Analysefunktionen bereitzustellen, gerade auch zu
Auswertung und logischer Wirkmodellierung von Gedanken und Satzkonstruktionen zur Verfügung
zu stellen. In diesem Kontext hat die Textverarbeitung vor allem auch dazu zu dienen, eventuelle
Fehler und Unvollkommenheiten der Spracherkennung auf möglichst effiziente Weise zu korrigieren
oder geschickt zu umgehen. Hierzu sind Dialogstrukturen mit entsprechenden Kommandos,
Transformationsfunktionen und Schlüsselwörtern bereitzustellen.