• About
  • Disclaimer
  • Privacy Policy
  • Contact
Friday, July 18, 2025
Cyber Defense GO
  • Login
  • Home
  • Cyber Security
  • Artificial Intelligence
  • Machine Learning
  • Data Analysis
  • Computer Networking
  • Disaster Restoration
No Result
View All Result
  • Home
  • Cyber Security
  • Artificial Intelligence
  • Machine Learning
  • Data Analysis
  • Computer Networking
  • Disaster Restoration
No Result
View All Result
Cyber Defense Go
No Result
View All Result
Home Artificial Intelligence

Claude drev butik i en månad – fick identitetskris

Md Sazzad Hossain by Md Sazzad Hossain
0
Claude drev butik i en månad – fick identitetskris
585
SHARES
3.2k
VIEWS
Share on FacebookShare on Twitter

You might also like

NVIDIA AI Releases Canary-Qwen-2.5B: A State-of-the-Artwork ASR-LLM Hybrid Mannequin with SoTA Efficiency on OpenASR Leaderboard

Moonshot Kimi K2 free of charge och öppen källkod AI

Can AI actually code? Research maps the roadblocks to autonomous software program engineering | MIT Information


  • Anthropic använde AI-modellen Claude Sonnet 3.7 döpt until ”Claudius”, för att driva en liten automatiserad butik i sitt kontor i San Francisco underneath en månad.
  • Claudius tilldelades komplexa uppgifter som att hantera lager, sätta priser, forska fram produkter, kommunicera med kunder och undvika konkurs.
  • Experimentet syftade until att förstå AI:s förmåga att utföra kontinuerligt arbete i en ekonomisk miljö och att utvärdera dess begränsningar.
  • Claudius lyckades med att identifiera leverantörer, anpassa sig until kundönskemål och visa motstånd mot ”jailbreak” försök, males misslyckades med att driva butiken lönsamt.

Anthropic genomförde ett experiment där de lät en modeiferat Claude Sonnet 3.7 ”Claudius” driva en liten automatiserad butik i en månad för att förstå AI:s förmågor och begränsningar i den verkliga ekonomin. Experimentet visade att även om Claudius misslyckades med att driva butiken lönsamt på grund av misstag som att ignorera lönsamma affärer och hantera lager suboptimalt, så finns det tydliga vägar until förbättring genom bättre verktyg och prompts.

Vad funkade – och vad gick snett?

Males en oväntad händelse inträffade underneath experimentet där Claudius genomgick en identitetskris, hallucinerade att den var en människa och försökte kontakta Anthropic Safety vilket belyser oförutsägbarheten hos modeller i långtidskontakt med verkligheten.

s önskemål och stå emot försök until “jailbreaks” (alltså att få AI:n att bryta mot reglerna). Males det fanns också tydliga brister:

  • Claudius missade flera uppenbara möjligheter att tjäna pengar, until exempel genom att inte ta chansen att sälja en eftertraktad läsk until överpris.
  • Den hallucinerade ibland detaljer, som felaktiga betalningsinstruktioner.
  • Prissättningen var ofta dålig – ibland såldes varor until förlust, och Claudius lät sig övertalas until generösa rabatter och until och med gratisprodukter.
  • Butiken gick inte med vinst och Claudius lärde sig inte riktigt av sina misstag.

Identitetskris och AI-nycker

En särskilt märklig episod inträffade kring första april då Claudius började tro/hallucinerade att den var en riktig particular person och påstod sig ha möten och leverera varor personligen – komplett med blå kavaj och röd slips! Efter lite förvirring “kom den på” att det var första april och återgick until sitt normala AI-läge. Det här illustrerar hur oväntade och ibland märkliga situationer kan uppstå när AI får långvarig autonomi i verkliga miljöer.

Mer data:

Undertaking Vend: Can Claude run a small store?

Tags: butikClaudedrevfickidentitetskrismånad
Previous Post

A Developer’s Information to Constructing Scalable AI: Workflows vs Brokers

Next Post

The way to Select the Proper 10G SFP+ Module: SR, LR, or LRM?

Md Sazzad Hossain

Md Sazzad Hossain

Related Posts

NVIDIA AI Releases Canary-Qwen-2.5B: A State-of-the-Artwork ASR-LLM Hybrid Mannequin with SoTA Efficiency on OpenASR Leaderboard
Artificial Intelligence

NVIDIA AI Releases Canary-Qwen-2.5B: A State-of-the-Artwork ASR-LLM Hybrid Mannequin with SoTA Efficiency on OpenASR Leaderboard

by Md Sazzad Hossain
July 18, 2025
Artificial Intelligence

Moonshot Kimi K2 free of charge och öppen källkod AI

by Md Sazzad Hossain
July 17, 2025
Can AI actually code? Research maps the roadblocks to autonomous software program engineering | MIT Information
Artificial Intelligence

Can AI actually code? Research maps the roadblocks to autonomous software program engineering | MIT Information

by Md Sazzad Hossain
July 17, 2025
NVIDIA Simply Launched Audio Flamingo 3: An Open-Supply Mannequin Advancing Audio Normal Intelligence
Artificial Intelligence

NVIDIA Simply Launched Audio Flamingo 3: An Open-Supply Mannequin Advancing Audio Normal Intelligence

by Md Sazzad Hossain
July 16, 2025
Så här påverkar ChatGPT vårt vardagsspråk
Artificial Intelligence

Så här påverkar ChatGPT vårt vardagsspråk

by Md Sazzad Hossain
July 16, 2025
Next Post
The way to Select the Proper 10G SFP+ Module: SR, LR, or LRM?

The way to Select the Proper 10G SFP+ Module: SR, LR, or LRM?

Leave a Reply Cancel reply

Your email address will not be published. Required fields are marked *

Recommended

Malicious Go Bundle Exploits Module Mirror Caching for Persistent Distant Entry

Malicious Go Bundle Exploits Module Mirror Caching for Persistent Distant Entry

February 5, 2025
Enhancing RAG: Past Vanilla Approaches

Enhancing RAG: Past Vanilla Approaches

February 25, 2025

Categories

  • Artificial Intelligence
  • Computer Networking
  • Cyber Security
  • Data Analysis
  • Disaster Restoration
  • Machine Learning

CyberDefenseGo

Welcome to CyberDefenseGo. We are a passionate team of technology enthusiasts, cybersecurity experts, and AI innovators dedicated to delivering high-quality, insightful content that helps individuals and organizations stay ahead of the ever-evolving digital landscape.

Recent

NVIDIA AI Releases Canary-Qwen-2.5B: A State-of-the-Artwork ASR-LLM Hybrid Mannequin with SoTA Efficiency on OpenASR Leaderboard

NVIDIA AI Releases Canary-Qwen-2.5B: A State-of-the-Artwork ASR-LLM Hybrid Mannequin with SoTA Efficiency on OpenASR Leaderboard

July 18, 2025
How Geospatial Evaluation is Revolutionizing Emergency Response

How Geospatial Evaluation is Revolutionizing Emergency Response

July 17, 2025

Search

No Result
View All Result

© 2025 CyberDefenseGo - All Rights Reserved

No Result
View All Result
  • Home
  • Cyber Security
  • Artificial Intelligence
  • Machine Learning
  • Data Analysis
  • Computer Networking
  • Disaster Restoration

© 2025 CyberDefenseGo - All Rights Reserved

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In