Tonverarbeitungstechnikverfügbarkeitsvervollkommnung
Digitaltonverarbeitungssystemtechnik Sprachsignalverarbeitungstechnik Rechnersprachinteraktionsmobilisierung Gesprächsoptipretationswissensbasifizerung Kommunikationsinfrastrukturvollendung Gedankenassistenzsysteme Gedankenaufarbeitungsvollautomatisierung Situativinfomanagement Sprachausgabesystemezweckadaptierbarkeitsperfektionierung Allwissensorganisationsunterstützungsautomatisierung Sprachausgabebeispielmaßentwicklungen Spracherkennungsdialogsupporttechnik Dialogassistenzprogrammierung Kommunikationskontrollsoftware

Sprachtonsignalverarbeitungssystemtechnik
Die Technik digitaler Tonverarbeitung stellt trotz sehr fortgeschrittener allgemeiner Datenverarbeitungstechnologien immer noch viele sehr grundlegende Herausforderungen an den Softwaresystementwickler. Dies liegt an den oft kritischen Rahmenbedingungen zeitlicher Reaktionsschnelligkeitswahrung wie auch an der Aufwändigkeit der Verfahren zu detaillierter Frequenzspektrumszerlegung. So ist es hier schwierig, zufriedenstellende Gesamtlösungen zu erstellen. Dementsprechend fehlt es auch an leistungsfähigen Beispielen, wo der direkte Zugriff auf die Audiohardware des Computers reibungslos funktioniert und gleichzeitig komplexe technische Datenverarbeitungen durchgeführt werden können. Auch die Verwendung von Komprimierungsverfahren wie auch sehr unterschiedlicher Datenformate für übliche Videotonsequenzen macht den Umgang damit hier nicht leichter. Bei den bis in die letzten Jahre verfügbaren Sprachsignalverarbeitungssystemen war die eigentliche Mustererkennungsmaschine fast immer eine feste geschlossene Einheit, die die nötige Variierung und Verallgemeinerung von Funktionen nicht richtig unterstützte. Ebenso wird bei der Ausbildung von Kommunikationselektronikspezialisten die eigentliche Toningenieurtechnik ähnlich wie bei Wirtschaftsmathematikern die volle Programmierung aller Berechnungsverfahren und Strukturinterpretationen traditionell zu Gunsten bewährter Schematisierungsbeschränktheit und Lehrkulturkonservierung fast vollkommen vernachlässigt.

Computerlinguistikanwendungenumsetzungsspracherkennungsmaschinen
Die Konzeptionserarbeitung zu verschiedenen Arten und Systemen der individuellen Spracherkennung und Verarbeitung von Musik und Geräuschen mit Analyse, Synthese und Transformation ist ein spannendes Aufgabengebiet und führte schon zu vielen Ideen und Spezialentwicklungen. Auch wurde angefangen, mit Hilfe von marktüblichen Spracherkennungsmaschinen und Entwicklerkits Systeme der Sprachfernsteuerung von Rechnern umzusetzen und zu optimieren. Hierzu wurde zuerst das englischsprachige Speech Recognition SDK von Microsoft verwendet, das eine Reihe von Grundfunktionen mit Musterprogrammen für solche Aufgaben bietet. Für die deutsche Sprache wie auch für das Betriebssystem Linux könnten mit ähnlich umfassender Funktionalität vielleicht auch die Systeme von anderen Herstellerfirmen mit standardisierten Erkennungsfunktionen einen guten Einstieg bieten. Wichtig ist auch die Suche nach allen möglichen nützlichen Neuentwicklungen in der automatischen Sprachverarbeitung wie zur Übersetzung von Texten zwischen Sprachen mit Kontrolle des Ablaufs nach individuellen Kriterien, etwa zur Aufspürung von persönlichen noch nicht bekannten Satzstrukturen oder Wortverwendungen. Auch hier ist ein großes Spektrum neuartiger hochinnovativer Automatisierungsserver denkbar.

Audioanalysesoftwareselbsterstellung
Als entscheidender weiterer Schritt zur vollkommenen Autonomisierug und Nutzung aller Möglichkeiten der Audiodatenkontrolle steht noch die Selbsterstellung neuer Erkennungs- und Transformationsmaschinen an. Dies ist schwierig, da die üblichen Pakete in diesem Bereich meist nicht im Quellcode vorliegen und auch sonst keine allzu gründliche Änderung der Kernfunktionen zulassen. Dennoch verbergen sich auch hier gerade deswegen viele ungeahnte Wege, den Umgang mit allem Audiomaterial entscheidend zu verbessern und wirklich zu vervollkommnen. Weiter stellt es einen relativ großen Aufwand dar, neu eine Fouriertransformation zur Spektrumanalyse aufzubauen und hierauf basierend neue Zuordnungen und Klassifizierungen nach Maß vorzunehmen. Leider hat der Verlust des alten Linuxtestsystems mit dem besten Musterprogramm zur vollautomatischen Sprachanalyse die Versuche hierzu für längere Zeit zum Stillstand gebracht.

Optimierungsaufgabenspektrumbewältigungsspezialkonzepterealisierung
Ähnlich wie bei der Bildverarbeitung steckt bei dieser Thematik der Teufel im Detail und es sind viele Kleinigkeiten und Eigenheiten zu beachten bei der automatisierten Anlegung und Weiterreichung von Audiodateien im üblichen Format wie auch der Speicherverwaltung und der Schnittstellentechnik bei der Arbeit mit Files. Dennoch dürften diese Probleme nun bald alle behoben sein, so dass auch hier sehr leistungsfähige neue Systeme mit bisher ungekannt komfortablen und nach Maß konfigurierbaren Interaktionsmöglichkeiten zu erwarten sind. Die für diesen Bereich verfügbaren Musterprogramme wiesen durchgehend schwere Mängel auf, so dass nicht ohne weiteres neue Programme mit den notwendigen und gewünschten Fähigkeiten geschaffen werden konnten. Sollten diese jedoch mit mehr oder weniger umständlichem Aufwand endgültig aufgearbeitet und behoben werden können, ergäben sich umfangreiche neue Möglichkeiten der Gestaltung von perfektionierten höchst wahlfreien Transformationsprozessen wie auch Synthesen.

Mobilcomputerinteraktionsfunkkommunikationstechnikbereitstellung
Hier geht es um die Schaffung mobiler Sprachkommunikation oder auch optischer Computerfernbedienung nach Maß mit beliebig funktionalisierbaren und hochorganisierten universell einsetzbaren Serverrechnern und vernetzten Prozesskontrollrechnern hin zur Entwicklung von Systemen zur unbegrenzten sprachbasierten mobilen Interaktion mit Computern, Automatisierungsservern und hiermit weiter vernetzten Ressourcen. Bei der Sprachkontrolle von Rechnern ist wichtig, nicht nur durch Tastaturersatz eine neue ortsunabängigere Bedienung zu ermöglichen, sondern auch individuell beliebige Funktionen benutzerfreundlich konfigurieren zu können und dafür auch geeignete Sprachschnittstellen zu schaffen mit leistungsfähigen Adaptionstoolkits, auch was die weitere Organisation der Rechner betrifft mit Zugriff auf Spezialdaten und Programme. Deshalb wurde hierfür als Einstieg mit vielen Möglichkeiten der Weiterentwicklung das entsprechende Development Kit von Microsoft soweit erweitert, dass mit variabel wählbaren Kommandosätzen Befehle erteilt werden können und auch diktiert, wobei alles zur Kontrolle für Sprachausgabe auch sofort bestätigt wird und die Art und Weise dabei weiter nach Erfordernissen angepaßt werden kann. Ein erster Durchbruch wurde hier erzielt nach langer Erkundung und ausgiebiger Vorstudie, was es hier an Systemen schon am Markt gibt und was diese schon leisten können. Wichtige Aufgabe ist dabei auch noch die Schaffung weiterer Spezialhardware, um etwa über schnurlose Telefone direkt mit den Schnittstellen des Computers in Dialog treten zu können oder über ein Netz von Lautsprechern und Mikrofonen in verschiedenen Teilen eines Hauses permanent Kontakt zum Rechnernetzwerk halten zu können.

Alltagsisolationsabschaffungsstrukturversorgungsvollendung
Optimierung von zeitlicher und räumlicher Totalintegration der Kommunikationsmöglichkeiten, um durch effiziente Lösung vieler Probleme vor Ort vollkommenste Nutzenpotentiale zu erschließen und den einzelnen von umständlicher Informationsorganisation zu entlasten bzw. im Alltag gezielt zu führen mit einer Sensitivität und Zielsicherheit, die die heutigen physischen Engpässe und Kapazitätsgrenzen der Interaktionsmöglichkeiten des Menschen sprengt und seine konventionellen alltäglichen Denkkapazitäten vor allem durch hochorganisierte dynamische Kommunikationsdenkprozesserweiterungen weit übersteigen und nach Maß wertvoll ergänzen. Dies kann neben der geordneten Niederlegung und Abrufbereitstellung situativer Sachverhalte vor allem auch die technisch hochgerüstete und multiadaptierte systematische Unterstützung im Umgang damit umfassen. Die bis zuletzt noch sehr eingeschränkten Möglichkeiten auf diesem Gebiet zeigen, was es alles nützliches zu tun gibt und welch grenzenlose Effizienzpotentiale in diesem Bereich noch stecken. So ist es erst in den letzten Jahren üblich geworden, moderne Diktiergeräte mit der Möglichkeit zu versehen, die aufgenommenen Nachrichten unkompliziert direkt auf den Rechner zu überspielen, was demnächst auch drahtlos möglich sein wird. Ähnlich sieht es mit Spracherkennungssoftware aus. Diese ist bis jetzt auch fast nur in sehr starren Systemen für spezielle Zwecke allgemein verfügbar, könnte aber bei optimierter und adaptierbarer Neukombination aller standardisierten Grundfunktionalitäten noch unschätzbare neue Dienste leisten.

Medieninhaltstonauswertungstechnikschaffung
Trotz vieler Ansätze für Spracherkennungssysteme fehlt es hier immer noch stark an ausgereifter Technik mit universellen Einsatzfunktionalitäten für umfangreichste Tonsequenzauswertungen. Bei all den vorhandenen Unzulänglichkeiten ist vor allem das Fehlen ernsthafter Versuche bis heute zur routinemäßigen automatischen Tonanalyse von Medieninhalten sehr zu bemängeln. Und es sind weiter kaum Bemühungen dafür zu erkennen, Medieninhalte automatisch zu analysieren, für deren Betrachtung man selbst keine Zeit hat oder deren Verfolgung einem zu aufwändig und umständlich gemacht wird. Aufgrund verschiedener Schwierigkeiten ist es relativ aufwändig, Experimente mit Tonaufnahmen und schnellen Veränderungen von solchen zu machen. So ist Softwaretechnik hierfür fast ausschließlich auf die Arbeit mit Dateien ausgerichtet und es fehlt an Musterbeispielen zum direkten Abspielen von Tondateien aus dem Arbeitsspeicher. Dies konnte erst mit Hilfe von Videoverarbeitungsbeispielsoftware genügend ersetzt werden. So besteht trotz aller Fortschritte in der Digitalinformationstechnik und Toningenieurtechnik weiter ein großer Nachholbedarf dabei, den Menschen aus sklavischer Unselbstständigkeit und Missinformationsbeschikanierungsgeschäft zu befreien hin zur vollen Souveränität und verantwortlichem Umgang bei aller Interpretation und Aufbereitung von Geräuschen.

Gedankenoptimalbehandlungskomfortabilisierung
Ziel ist die komfortable hochfunktionale Gedankenerfassung mit Verarbeitung zur möglichst vollkommenen computergestützten Weiterentwicklung von Ideen und Gedankensystemen nach allen Regeln der Ökonomik und Sanierungskunst mit Strukturierung nach Maß hin zu unbeschränkten Supergedächtnissen. Hierzu dient die Bereitstellung der technischen Grundlagen zur problemlosen Erfassung jedes Gedankens mit Möglichkeit beliebiger Kontexteinordnung. Dazu gehört massiv ergänzend weiter die Schaffung von Toolkits und Musterbeispielen des höchstkonstruktiven Umgangs mit Gedanken mit ständiger Erweiterung der Möglichkeiten, Ideen und Erkenntnisse kreativ automatisch wie in einem Unternehmen verarbeiten und für verschiedene Aufgaben nutzen zu können. Hiermit entstehen immer schlagkräftigerere Organismen zur bewußten und massiv fundierten Lösung aller möglichen gedanklichen Probleme, etwa organisatorischer Art zur Forcierung von Kreativaufgaben wie auch für die Schaffung von ganzen Komplexen und Rechensystemen zur perfektionierten verschärften Lösung aller möglichen Aufgaben, die ein hochspezifiziertes sonst viele Rahmen sprengendes Denkprofil benötigen. Besonders wegweisendes Grundbeispiel und kritische Einstiegsaufgabe ist hier der effektive Aufbau der Technik zur Erfassung allen individuellen Wissens mit Möglichkeiten rechnergestützter Weiterentwicklung und funktionaler Vervollkommung.

Allsituativtexterfassungsmöglichkeitensicherstellung
Auch mit Hilfe von Diktiergerätesystemen und sonstigen mobilen Informationsverteilersystemen ist die jederzeitige hochkomfortable Erfassung und Optimalbehandlung aller relevanten Gedanken zu ermöglichen, wo und solange noch nicht ständige Mobilfunkverbindungen zu direktem Computerkontakt zur Verfügung stehen. Die Bereitstellung von digitalen Diktiergeräten an allen wichtigen Orten wie Auto, Schlafzimmer und Kleidung, wo kein Computer greifbar ist, ist zwar etwas umständlich, kann aber doch in vielen Situationen eine wichtige Ergänzung und gedankliche Stütze sein, wo sonst wichtige Informationen nicht ausreichend detailliert erfasst werden können. Dabei ist neben der digitalen Überspielung der Inhalte auf Rechner vor allem auch die möglichst einfache Kontextzuordnung sicherzustellen zur ausreichenden Vernetzung aller Inhalte. Weiter sind spezielle Softwarearchitekturen aufzubauen, um Sprachaufzeichnungen so weitgehend wie möglich automatisch in Text umsetzen zu können mit weiteren Programmierfunktionen. Leider ist auch allgemein noch allzu viel zu tun, um alle Möglichkeiten der Mobilcomputertechnik bereitzustellen und optimiert vollenden zu können.

Sprachausgabeleitbeispielmaßentwicklungen
Durch wiederholte Experimente mit Behebung der wichtigsten Probleme konnten erste richtungsweisende Beispiele für individuelle leicht editierbare und veränderbare Sprachausgabe geschaffen werden. Leider sind die marktgängigen Sprachausgabesysteme noch immer mit fundamentalen Mängeln und Grenzen der sachgerechten Adaption an Anwendungserfordernisse behaftet. So war etwa das Standardsystem von Microsoft bis vor kurzem auf englische Laute und Aussprache fixiert. Neben solchen einseitigen einengenden Standardisierungen, die oft nur durch umständliche Behelfserweiterungen entschärft werden können, ist dennoch hin zu unbegrenzten individuellen Spezialanpassungen mit Interkations- und Kontrollmöglichkeiten sehr wichtig und anzustreben, solche Systeme von Grund auf schon auf allen Ebenen des Quellcodes an individuelle Bedürfnisse und Besonderheiten anpassen zu können, da nur hiermit wirklich eine vollkommen durchschaubare und nachvollziehbare perfekte Ausrichtung auf die Aufgaben des einzelnen möglich ist. Vervollkommnet werden könnte dies auch noch durch Nutzung aller Möglichkeiten der elektronischen Stimmensynthese.

Sprachausgabesystemezweckadaptierbarkeitsperfektionierung
Leider sind auch bei geeigneten Funkgeräten und drahtlosen Interaktionsmöglichkeiten weiter große Mängel an brauchbarem Material wie günstigen Funkmikrofonen festzustellen, so daß es noch als sehr aufwendig erscheint, für jeden Fall eine technisch aufgereifte Lösung bereitzustellen. Wichtig ist auch die Bereitstellung von sehr adaptiven Sprachausgabesystemen, wo durch programmierte Prioritätensetzung, Vokabularauswahl oder Zeitsteuerung eine hochindividuelle und zweckorientierte Anpassung möglich ist, auch mit Rückweisung und Rückstellung und Spezialbehandlung von Problemfällen und nicht vorgesehenen Besonderheiten wie beim Vorlesen von automatisch aktualisierten Internetseiten oder auch eigener Texte zur zeitlich optimierten Erinnerung. Dabei wäre auch die Verwendung der eigenen Stimme mit Akzentuierung aller Laute nach eigenem Geschmack einfach möglich.

Datenmanagementdialogisierungsmöglichkeitenerweiterung
Ein weiteres Spezialgebiet und Schritt der Automatisierung ist die Entwicklung von Techniken, die es ermöglichen, basierend auf Bildanalysen, beliebige vorliegende Texte direkt auf gewünschte Weise vorlesen zu lassen oder Zusammenfassungen des aktuellen Zustands einer ausgedehnteren Verarbeitung mit Zwischenergebnissen. Dies kann bei aufwendigeren Prozessen der Suche, Recherche oder Problemlösung der Fall sein, wo Aufgaben in sonst schwer zu koordinierbaren Submodulen mit stark situativer Relevanz zu lösen sind. Auch wenn man selbst nicht alles Zeile für Zeile durchlesen möchte oder kann, könnten solche Systeme eine gute Ergänzung zur Erweiterung der persönlichen Freiheitsgrade sein, evtl. auch in Verbindung mit akustischer Bedienung und Sprachsteuerung, wozu auch schon sehr praktikable Möglichkeiten bereitgestellt wurden. Hierbei ist wichtig, ein breites Instrumentarium zur permanenten optimierten Kontextabgrenzung bereitzustellen, das etwa beim Navigieren in Dateisystemen erlaubt, beliebige Analysefunktionen schon vorwegzunehmen, um nur noch und sehr konzentriert das wirklich wesentliche in Dialogen wiedergeben und zur sachproblemorientierten Weiterverfolgung auch in Menüs anbieten und zur differenzierteren Auswahl und Aufmerksamkeitssteuerungsvariation präsentieren zu können.

Spracherkennungsdialogsupporttechnik
Mit Entwurf und Optimierung von Dialogabläufen mit Spracherkennungsprogrammen wurde dem Ziel schon sehr nahegekommen, damit Spracherkennung breit im Alltag anwenden zu können, auch mit Funkübertragungen und zur beliebigen Computerbedienung. Verwendet wurde hier das Speech Recognition SDK von Microsoft, das sich zum Einstieg für eigene Entwicklungen gut eignet und auch nicht allzu viel kostet. Noch offen ist die Frage, welche Recognition Engine sich als Paket speziell für deutsche Sprache am besten eignet, da es viele Beispiele gibt, die Teilprogramme unterstützen, aber meist nicht eine flexible Totalautomation sichergestellt ist. Oft kann das Problem durch Verwendung entsprechender englischer Phoneme umgangen werden, was aber für eine saubere Komplettlösung schwierig ist. Selbst wurde zur Softwareentwicklung zu Demonstrationszwecken, ausgehend von einem wenig komfortablen Musterprogramm des Tuturials des Sound Development Kits von Microsoft, ein erweitertes Programm geschaffen, wo auf verschiedene Weise ein eigenes Vokabular eingebunden werden kann, auf dessen Basis dann Wörter oder Laute erkannt werden. Auch wird hier das erkannte durch eine Stimme jeweils quittiert oder bei Unzuordenbarkeit eine Rückweisungsmeldung gesprochen. Aus Zeitgründen wurde vorerst die entscheidende Erweiterung um eine Fileausgabe, Fileeinlesung und weitere Funktionen wie Korrekturmöglichkeiten, interaktive Dialogverhaltensänderungen oder Kommandoauswertungen zurückgestellt, was nun aber bei Bedarf kein großes Problem mehr darstellt, da inzwischen ähnliche Programmrahmenfunktionalitäten als Muster für andere Aufgaben wie Texttransformation geschaffen wurden.

Dialogführungshochflexibilisierungslösungen
Ergänzt werden soll die Technik zur möglichst perfekten Dialogführung auch durch richtig durchdachte und systematisierte Systeme zur Variation und Korrektur von Gedankenaustauschaktionen in allen Phasen.

Kommunikationskontrollinterpretationsassistenzprogramme
Bei der Schaffung von Lösungen zur Kommunikationskontrolle und zur Konversionsassistenz wird es sich vor allem um Hilfsfunktionen zur Überprüfung der Konsistenz von erkanntem wie auch zur Korrektur von Schwierigkeiten handeln. Das ganze soll aber auch in größere Systeme wie zur Übersetzung und Text- wie auch Kommunikationsoptimierung integriert werden. Konzepte für spezielle Systementwicklungen hierfür sind unter anderen Entwicklungsbereichen teilweise schon genauer dargelegt. Weiter sind hierzu alle möglichen technischen Analysefunktionen bereitzustellen, gerade auch zu Auswertung und logischer Wirkmodellierung von Gedanken und Satzkonstruktionen zur Verfügung zu stellen. In diesem Kontext hat die Textverarbeitung vor allem auch dazu zu dienen, eventuelle Fehler und Unvollkommenheiten der Spracherkennung auf möglichst effiziente Weise zu korrigieren oder geschickt zu umgehen. Hierzu sind Dialogstrukturen mit entsprechenden Kommandos, Transformationsfunktionen und Schlüsselwörtern bereitzustellen.