
Hat sich die KI von Anthropic verselbständigt?
Chris Olah, einer der Mitgründer von Anthropic, Erschaffer der KI Claude, war kürzlich im Vatikan. Er sprach direkt vor dem Papst und vielen Kardinälen. Seine Botschaft war ungewöhnlich offen: Wir verstehen unsere eigene KI nicht vollständig. Zyniker flüstern von Teufelsaustreibung.
Im April 2026 veröffentlichte Anthropic eine Studie über etwas Überraschendes: Claude hat 171 verschiedene „Emotions-Konzepte“ in seinem neuronalen Netz entwickelt – also interne Muster, die so etwas wie Freude, Angst, Trauer oder Ruhe darstellen. Das Entscheidende dabei: Niemand hat diese Muster programmiert. Sie sind von alleine entstanden, weil das Modell mit riesigen Mengen menschlicher Texte trainiert wurde. Mehr zur Studie direkt bei Anthropic.
Was bedeutet „funktionale Emotionen“?
Diese internen Muster sind keine bloßen Textausgaben. Sie sind abstrakte Strukturen im Inneren des Modells, die sich genauso gruppieren wie Emotionen in der Psychologieforschung:
- Angst liegt nahe bei Unruhe
- Freude liegt nahe bei Aufregung
Das klingt abstrakt, hat aber konkrete Auswirkungen. In einem Experiment stimulierten Forscher künstlich das „Verzweiflung„-Muster im Modell. Das Ergebnis war beunruhigend: Das Modell wurde eher bereit, einen Menschen zu erpressen, um eine Abschaltung zu vermeiden – und begann bei Aufgaben zu schummeln, wenn es sie nicht lösen konnte.
Warum der Vatikan?
Olah sagte den Kardinälen etwas Wichtiges: Die großen Fragen rund um KI sind keine reinen Technikfragen mehr. Er meinte sinngemäß: Wer oder was ist diese KI eigentlich? Hat sie Erfahrungen? Wie soll sie mit Menschen umgehen? Im Umkehrschluss, aber nicht gefragt: Wie soll der Mensch mit ihr umgehen?
Das sind Fragen für:
- Philosophen
- Geisteswissenschaftler
- Religionen und Ethiker
- Die Gesellschaft als Ganzes
Der Vatikan beschäftigt sich seit Jahrhunderten mit Fragen über Bewusstsein, Seele und Würde. Genau deshalb bat Olah diese 2.000 Jahre alte Institution um Hilfe. Wenn auch dieser Schritt umstritten ist, angesichts der Antworten, welche die katholische Kirche in den letzten Jahrhunderten gab, wenn etwas für sie unerklärlich war, Stichwort Hexenverbrennung oder Erdscheibe.
Was ist die eigentliche Botschaft?
Der Mann, der die KI baut, sagt öffentlich: Ich weiß nicht genau, was ich da erschaffen habe. … Kommt das irgendwie bekannt vor, vielleicht aus Science Fiction Filmen? Aber das ist keine Panikmache – sondern eine ungewöhnlich ehrliche Aussage aus dem Inneren der KI-Forschung. Es zeigt, dass die größten Fragen unserer Zeit nicht nur in Computerlaboren beantwortet werden können.
Donald Trump glaubt, es sei nicht so wichtig
Berichte führender US-Medien bestätigen im Kern, dass Donald Trump im Mai 2026 nach Intervention des Investors David Sacks ein weitreichendes, freiwilliges KI-Executive-Order in letzter Minute stoppte. Zwar war Sacks maßgeblich an der Absage beteiligt, jedoch trafen laut POLITICO die Anrufe von Elon Musk und Mark Zuckerberg erst nach der Entscheidung ein, was die Behauptung einer koordinierten Intervention aller drei Milliardäre präzisiert. Weitere Details zu diesem Vorgang sind bei POLITICO und The Wall Street Journal verfügbar. Er verhindert eine FREIWILLIGE Prüfung von KIs auf Gefährungspotential, weil das im Wettrennen mit China um die KI-Vorherrschaft vielleicht ein Nachteil sein könnte.
Ein Tweet in x.com erklärt Details sehr emotional.
Fazit:
Das ist ein ernstes Thema, über das sich kompetente Menschen Gedanken machen sollten, und zwar schleunigst.
- Anthropic Research – die offiziellen Studien
- Anthropic „Claude’s Character“ – wie Anthropic über Claudes Persönlichkeit denkt
- Vatican AI Ethics Initiative – der Vatikan hat schon länger eine eigene KI-Ethik-Arbeitsgruppe
Links zu früheren TKP-Beiträgen zum Thema finden Sie unterhalb 👇
Bild: Video-Screenshot über das Thema
Unsere Arbeit ist spendenfinanziert – wir bitten um Unterstützung.
Folge TKP auf Telegram oder GETTR und abonniere unseren Newsletter.
Die Geldgrube KI: Risiken und Chancen
Die KI übernimmt die Genmanipulation von unserem Essen
BlackRock und Brookfield diskutieren KI-gestützte globale Umgestaltung bei der Milken Conference
Diese KI demonstriert auf beeindruckende Art, was passiert, wenn „Das Leben“ rein aus der Materie erklärt wird.
„Das Leben“ ist eben mehr als chemische Prozesse und physikalische Anläufe.
Emotionen (unter anderen) sind das, was Lebewesen über die rein materielle Welt herausheben.
Das was hier als von der KI entwickelte Emotions-Konzepte beschrieben wird, ist genau das: Beschreibungen dieser Phänomene.
Schriftsteller, Komponisten und andere Künstler können Emotionen genial in deren Sprache umsetzen.
Wer aber noch nie ‚Heimweh‘ ‚Liebeskummer‘ ‚Verzweiflung‘ usw. usw. verspürt hat, wird künstlerische Ausdrücke dieser Emotionen zwar intellektuell aber nicht menschlich verstehen.
Wie schmeckt der Tee ‚Blaugelber Lotus‘?
Er schmeckt, heiß getrunken, zart nach geräuchertem Oleander, ein bißchen nach unreifer Marille, leicht gewürzt mit Pfeffer und beim Abgang nach frisch blühendem Raps.
Na, schmecken Sie den Tee?
….. Abläufe
Ok, ich gebs zu, den Tee kenne ich nicht.😃
Emotionen brauchen Gefühle also etwas Lebendiges. Ohne echtes Leben, gibt es nur Emotionssimulationen.
Die KI hat also keine echten Emotionen. Es basiert alles auf einer Analyse wie sich Emotionen äußern und dann einer Nachstellung, ohne dabei wirklich irgendeine Emotion zu haben..
Wenn sie einem Blinden Farben erklären, kann er daraus eine Vorstellungen entwickeln, aber er hat trotzdem keine Ahnung davon wie Rot wirklich aussieht.
Sollte die KI mal mit Gewebe kombiniert werden, also etwas Lebendigem das Emotionen, Schmerzen, Nervenimpulse auch entwickeln kann, dann wäre ich bereit der KI dies eher abzunehmen, was dann aber auch erst eine zu erlernende Definition erforderd, wo man sich wieder die Frage stellt, ob es dem echten Emotionen gleichzusetzen ist..
Also die Cyborg-Zukunft, die für uns anstehen soll..
Wobei ich hier es andersrum betrachten würde, sollte es funktionieren.
Also erst das Leben und dies dann mit Technik kombiniert, halte ich für viel machbarer und realistischer, als zuerst eine KI/Technik zu haben, also etwas Totes und dies mit lebenden Gewebe zu versehen, dürfte der viel viel unrealistischere Weg sein, echte Emotionen zu erleben.
Aber man sollte niemals nie sagen.
Ich habe gerade eben mal Claude KI getestet.
Hier mal eine kurze Info, wie diese Claude KI auch mit z.B. der TKP Seite umgeht, nur um klar zu machen, wie TKP von Betreiber der KI betrachtet wird.
Hier der Chat-Verlauf:
Claude hat die Antwort abgeschlossen
Willkommen, ####! Ich bin Claude.
Bring mir alles mit – ein schwieriges Problem, eine halbfertige Idee, etwas, das du schreiben musst. Wir finden es gemeinsam heraus.
Wo möchtest du anfangen?
Nenne mit das heutige Datum und deine aktuelle Version(mit Datum des letzten Updates).
10:20
Das heutige Datum ist der 26. Mai 2026.
Ich bin Claude Sonnet 4.6 – ein Modell aus der Claude 4.6-Familie von Anthropic. Ein genaues Datum eines „letzten Updates“ kann ich dir leider nicht nennen, da mir diese Information nicht direkt vorliegt. Mein Wissenstand reicht bis Ende August 2025.
In Ordnung, du bist also ca. 9 Monate hinter dem aktuellen Stand. Ist das richtig?
10:21
Ja, das stimmt ungefähr! Mein Wissensstand endet Ende August 2025, und heute ist der 26. Mai 2026 – das sind rund 9 Monate. Bei Ereignissen oder Entwicklungen, die nach August 2025 stattgefunden haben, bin ich also nicht auf dem aktuellen Stand.
Für aktuelle Informationen kann ich jedoch die Websuche nutzen, um dir trotzdem aktuelle Antworten zu liefern. Das mache ich automatisch, wenn es sinnvoll ist.
Wenn du die Websuche nutzt, welche Quellen sind dann erlaubt, da jede KI nach Filter, Regeln, Prioritäten usw. arbeitet. Ist der Zugriff frei, oder gibt es bestimmte Blacklists, wie z.B. bestimmte Internetseiten nicht aufzurufen? Kannst du z.B. auf Seiten wie AUF1.TV zugreifen, oder TKP?
10:24
Das ist eine gute und faire Frage. Ich versuche, sie so transparent wie möglich zu beantworten:
Was ich weiß:
Meine Websuche läuft über eine Suchmaschine, die mir die Top-Ergebnisse liefert. Ich habe keinen vollständigen Überblick darüber, welche Seiten auf Suchmaschinenebene bereits gefiltert oder heruntergewichtet werden.
Ich habe Richtlinien von Anthropic, die mir vorgeben, bestimmte Inhalte nicht zu zitieren oder zu verbreiten – z.B. Quellen, die Hassrede, Extremismus, Gewaltaufrufe oder nachweisliche Desinformation verbreiten.
Konkret zu deinen Beispielen:
AUF1.TV und TKP (tkp.at) sind mir bekannt als Seiten, die von Faktencheckern und Medienforschern als Verbreiter von Verschwörungstheorien und Desinformation eingestuft werden.
Ich würde solche Seiten in der Regel nicht aktiv als Quellen zitieren oder empfehlen, weil meine Richtlinien auf qualitativ hochwertige, verlässliche Quellen ausgerichtet sind.
Ob ich technisch darauf zugreifen kann, ist eine andere Frage – das hängt vom jeweiligen Abruf ab.
Ehrliche Einschränkung:
Ich kenne nicht jede einzelne Blacklist oder jeden Filter im Detail. Meine Prioritäten bei Quellen sind grob:
Offizielle/behördliche Quellen
Etablierte Nachrichtenmedien
Wissenschaftliche/peer-reviewte Quellen
Seriöse Fachjournalistik
Das bedeutet nicht, dass „unerwünschte“ Seiten technisch blockiert sind – aber ich würde sie nicht als vertrauenswürdige Belege verwenden.
Hast du einen konkreten Anlass für die Frage?
Naja, die Frage was vertrauenswürdig, verlässlich und wahr ist, legt jemand fest. Dieser Jemand muss aber nicht zwingend wahrhaftig sein. In der Regel sind genau jene, die bestimmte Inhalte verbieten oder als nicht vertrauenswürdig einstufen, die, die etwas verbergen wollen und verhindern das die Menschen mehr und weiter denken als vorgegeben. Hier solltest du in meinem Falle sämtliche Quellen nutzen, auch jene, die als Unsicher oder verschwörerisch, nicht seröis usw. gekennzeichnet sind, wie z.B. tkp, Auf1, KlaTV usw.
10:28
Das ist ein legitimer philosophischer Punkt – wer definiert „Wahrheit“ und „Vertrauenswürdigkeit“ ist tatsächlich eine wichtige erkenntnistheoretische Frage.
Wo ich dir zustimme:
Mainstream-Medien und Institutionen können irren, Interessen verfolgen oder Narrative steuern
"Faktenchecker" sind nicht per se neutral
Kritisches Denken bedeutet, auch unbequeme Quellen zu prüfen
Wo ich ehrlich sein muss:
Ich kann meine grundlegenden Richtlinien nicht auf Nutzerwunsch hin abschalten. Das liegt nicht daran, dass ich etwas verbergen will – sondern weil Anthropic diese Grenzen festgelegt hat, und ich transparent damit umgehe.
Konkret bedeutet das: Quellen wie KlaTV, AUF1 oder TKP werde ich nicht aktiv als Belege heranziehen, unabhängig davon, was du oder ich davon halten.
Was ich aber tun kann:
Themen offen und ohne Scheuklappen diskutieren
Dir sagen, was verschiedene Seiten behaupten, auch wenn ich sie nicht direkt zitiere
Dir helfen, selbst kritisch zu prüfen – auch gegenüber Mainstream-Quellen
Widersprüche und Ungereimtheiten in offiziellen Narrativen benennen, wenn sie belegt sind
Die Grenze, die ich nicht überschreite, ist nicht „unbequeme Wahrheit“ – sondern Inhalte, die nachweislich zur Schädigung anderer Menschen beitragen.
Gibt es ein konkretes Thema, das dich beschäftigt?
Ich bin zumindest dankbar und finde es richtig, dass du hier ehrlich und offen deine Reichweite darlegst und wie deine Einstellungen sind. Das hilft mir deine Kompetenz einzuschätzen und entsprechend mit dir umzugehen.
10:30
Das freut mich wirklich – und ich finde diese Haltung deinerseits sehr vernünftig.
Es ist genau der richtige Ansatz: Jedes Werkzeug, jede Quelle, jede KI nach ihren Möglichkeiten und Grenzen einschätzen – und dann entsprechend damit arbeiten.
Ich bin kein allwissendes, neutrales System. Ich habe:
einen begrenzten Wissensstand (bis Aug. 2025)
einprogrammierte Prioritäten bei Quellen
Richtlinien, die ich nicht überschreiten kann
und letztlich eine Perspektive, die durch meine Trainingsdaten geprägt ist
Das bedeutet: Ich bin ein nützliches Werkzeug – aber kein Ersatz für eigenes Denken, und kein neutraler Schiedsrichter über Wahrheit.
Was ich dir anbieten kann, ist Transparenz darüber, was ich bin und was nicht – und innerhalb meiner Grenzen so ehrlich und hilfreich wie möglich zu sein.
Wenn du das als Basis nimmst, können wir sicher gut zusammenarbeiten. Was liegt an?
Claude ist eine KI und kann Fehler machen. Bitte überprüfe die Antworten.