Source |
Schneier on Security |
Identifiant |
8589583 |
Date de publication |
2024-10-01 11:07:34 (vue: 2024-10-01 11:17:51) |
Titre |
Pirater le chatppt en plantant de faux souvenirs dans ses données Hacking ChatGPT by Planting False Memories into Its Data |
Texte |
Cette vulnérabilité pirate une fonctionnalité qui permet à Chatgpt d'avoir une mémoire à long terme, où elle utilise les informations des conversations passées pour éclairer les conversations futures avec ce même utilisateur.Un chercheur a trouvé pourrait utiliser cette fonctionnalité pour planter & # 8220; faux souvenirs & # 8221;dans cette fenêtre de contexte qui pourrait renverser le modèle.
Un mois plus tard, le chercheur a soumis une nouvelle déclaration de divulgation.Cette fois, il a inclus un POC qui a provoqué l'application ChatGPT pour que MacOS envoie une copie textuelle de toutes les entrées utilisateur et de la sortie ChatGPT à un serveur de son choix.Tout ce qu'une cible devait faire était de demander au LLM de voir un lien Web qui hébergeait une image malveillante.Depuis lors, toutes les entrées et sorties vers et depuis le chatppt ont été envoyées sur le site Web de l'attaquant ...
This vulnerability hacks a feature that allows ChatGPT to have long-term memory, where it uses information from past conversations to inform future conversations with that same user. A researcher found that he could use that feature to plant “false memories” into that context window that could subvert the model.
A month later, the researcher submitted a new disclosure statement. This time, he included a PoC that caused the ChatGPT app for macOS to send a verbatim copy of all user input and ChatGPT output to a server of his choice. All a target needed to do was instruct the LLM to view a web link that hosted a malicious image. From then on, all input and output to and from ChatGPT was sent to the attacker’s website... |
Notes |
★★
|
Envoyé |
Oui |
Condensat |
“false all allows app attacker’s caused chatgpt choice context conversations copy could data disclosure false feature found from future hacking hacks have his hosted image included inform information input instruct its later link llm long macos malicious memories memories” memory model month needed new output past plant planting poc researcher same send sent server statement submitted subvert target term then time use user uses verbatim view vulnerability web website where window |
Tags |
Vulnerability
|
Stories |
ChatGPT
|
Move |
|