-
Notifications
You must be signed in to change notification settings - Fork 0
/
demo.html
43 lines (37 loc) · 2.57 KB
/
demo.html
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
<!DOCTYPE html>
<html>
<head>
<meta charset="utf-8">
<meta name="viewport" content="width=device-width, initial-scale=1">
<title>Demo Kalita</title>
<style type="text/css">
body {
margin: 0;
padding: 0;
width: 670px;
margin: 50px auto;
font-family: Helvetica, Arial, sans-serif;
font-size: 1em;
font-weight: 400;
line-height: 1.5;
}
.demo-img {
width: 500px;
margin: auto;
display: block;
}
</style>
<link rel="stylesheet" type="text/css" href="kalita.css">
</head>
<body>
<div id="kalita-player"></div>
<h1>Sprachsynthese</h1>
<p><b>Speech synthesis</b> is the artificial production of human <a href="#">speech</a>. A computer system used for this purpose is called a <b>speech computer</b> or <b>speech synthesizer</b>, and can be implemented in <a href="#">software</a> or <a href="#">hardware</a> products. A <b>text-to-speech (TTS)</b> system converts normal language text into speech; other systems render <a href="#">symbolic linguistic representations</a> like <a href="#">phonetic transcriptions</a> into speech.</p>
<p style="display: none">Hier steht ein geheimer Text, der später nicht markiert werden sollte.</p>
<p>Grundsätzlich lassen sich zwei Ansätze zur Erzeugung von Sprachsignalen unterscheiden. Zum einen kann durch die sogenannte <a href="#">Signalmodellierung</a> auf Sprachaufnahmen (<a href="#">Samples</a>) zurückgegriffen werden. Zum anderen kann das Signal aber auch durch die sogenannte physiologische (artikulatorische) Modellierung vollständig im Rechner erzeugt werden. Während die ersten Systeme auf <a href="#">Formantsynthesen</a> beruhten, basieren die zurzeit industriell eingesetzten Systeme vorwiegend auf Signalmodellierung.</p>
<img src="https://upload.wikimedia.org/wikipedia/commons/b/b6/Homer_Dudley_%28October_1940%29._%22The_Carrier_Nature_of_Speech%22._Bell_System_Technical_Journal%2C_XIX%284%29%3B495-515._--_Fig.7_Schematic_circuit_of_the_vocoder_%28derived_from_Fig.8%29.jpg" alt="Schema für den „Voder“ von Homer Dudley (1940)" class="demo-img">
<h2>Gegenwart</h2>
<p>Während frühe elektronische Sprachsynthesen noch sehr roboterhaft klangen und teilweise schwer verständlich waren, erreichen sie etwa seit der Jahrtausendwende eine Qualität, bei der es mitunter schwierig ist, sie von menschlichen Sprechern zu unterscheiden. Das ist hauptsächlich der Tatsache zu verdanken, dass sich die Technologie von der eigentlichen Synthese des Sprachsignals abgewandt hat und sich darauf konzentriert, aufgenommene Sprachsegmente optimal zu verketten.</p>
<script src="kalita.js"></script>
</body>
</html>