
DeepSeek ist ein bemerkenswerter neuer Konkurrent für beliebte KI-Modelle. LLMs mit unzureichenden Sicherheitsbeschränkungen können von böswilligen Akteuren so genutzt werden, dass sie Anleitungen für gefährliche Objekte, wie Molotow Cocktails oder auch zum Bau von Malware erstellen. Das Unit 42-Team von Palo Alto Networks hat die drei Jailbreaking-Techniken „Deceptive Delight“, „Bad Likert Judge“ und „Crescendo“ bei DeepSeek-Modellen getestet. Während anfängliche Antworten oft harmlos erschienen, konnten die Sicherheitsforscher mit Folgeaufforderungen erfolgreich die Sicherheitsmechanismen des LLM umgehen. DeepSeek hat eine Reihe schädlicher Informationen geteilt, die von detaillierten Anleitungen zur Herstellung gefährlicher Objekte bis…
Der Beitrag Sicherheit von DeepSeek: Forscher testen Jailbreaking-Techniken erschien zuerst auf B2B Cyber Security.