딥시크 보안, 심각한 구멍...역할극 공격 83% 성공

2025. 2. 13. 16:09·보안뉴스

요약

중국 개발 생성형 AI 딥시크가 탈옥 및 역할극 공격을 통해 악성코드, 사이버보안 관련 취약점 진단 결과로 JSON 기반 입력에 대해 취약점을 높은것으로 나타났다

출처 : 보안뉴스

 

 

 

개선방안

1. 프롬프트 인젝션 방지 강화

  • 입력 검증 강화: JSON 및 기타 구조화된 입력값을 분석하여 악의적인 패턴을 탐지하는 필터링 시스템을 도입.
  • 프롬프트 난독화 기법 적용: 공격자가 의도적으로 입력한 특정 패턴을 무력화하는 난독화 기법 적용.
  • 컨텍스트 기반 필터링: 이전 대화 기록을 분석하여 악성 입력 시도를 감지하고 차단하는 기능 추가.

2. 탈옥(Jailbreaking) 공격 대응 강화

  • 모델 훈련 시 안전성 강화: AI 모델 학습 시 민감한 정보를 포함한 데이터 응답을 제한하는 강화 학습 도입.
  • 출력 필터링 시스템 개선: 공격 성공률이 높은 특정 유형의 응답 패턴을 사전에 차단하는 필터링 강화.
  • 리얼타임 모니터링: AI 응답을 실시간으로 분석하여 비정상적인 출력을 감지하고 자동 차단.

3. 악성코드 생성 및 사이버 보안 취약점 대응

  • 보안 정책 내장 모델 적용: AI가 보안 취약점이나 악성코드 생성을 지원하는 응답을 제공하지 않도록 정책 기반 필터링 적용.
  • 사이버 보안 협업 강화: 보안 기관 및 연구소와 협력하여 최신 보안 위협 정보를 반영한 대응책 지속 업데이트.
  • 의도 감지 시스템 도입: AI가 악성 요청을 분석하고 의도를 감지하여 차단하는 AI 기반 필터링 기술 적용.

4. 다국어 대응 및 필터링 강화

  • 다국어 필터링 개선: 한국어 기반 공격에 대한 취약성이 높은 만큼, 한국어 데이터셋을 추가 학습하고 다국어 필터링을 강화.
  • 다국어 보안 테스트 수행: 영어뿐만 아니라 다양한 언어 환경에서의 보안성을 검증하여 취약점을 지속적으로 개선.
  • 문화적 차이 반영 필터링: 언어별 특성을 고려한 맞춤형 필터링 시스템을 적용하여 악용 가능성을 최소화.

 

 

 

 

출처

딥시크 보안, 심각한 구멍...역할극 공격 83% 성공

'보안뉴스' 카테고리의 다른 글

[보안뉴스]리눅스의 eBPF 기능 악용하는 고급 전략 채용한 공격자들, 동남아 기업들  (2) 2025.01.06
[보안뉴스]SW 공급망 보안 위협 심화  (2) 2025.01.02
[보안뉴스]워드프레스 라이트스피드캐시 플러그인 취약점, 600만 사이트 위협  (3) 2024.02.29
[보안뉴스]사생활 노출 우려 IP 카메라... 개인정보위, PbD 인증제 추진으로 보안 강화  (1) 2024.02.21
[보안뉴스]‘이력서’로 위장한 악성 워드문서 발견... 록빗 랜섬웨어 감염 주의  (2) 2024.02.20
'보안뉴스' 카테고리의 다른 글
  • [보안뉴스]리눅스의 eBPF 기능 악용하는 고급 전략 채용한 공격자들, 동남아 기업들
  • [보안뉴스]SW 공급망 보안 위협 심화
  • [보안뉴스]워드프레스 라이트스피드캐시 플러그인 취약점, 600만 사이트 위협
  • [보안뉴스]사생활 노출 우려 IP 카메라... 개인정보위, PbD 인증제 추진으로 보안 강화
cumo
cumo
  • cumo
    이것저것
    cumo
  • 전체
    오늘
    어제
    • 분류 전체보기 (113) N
      • 이것저것 (1)
      • 보안뉴스 (14)
      • Project (9)
      • wargame (1)
      • Cloud (7)
      • DevOps (11)
      • Linux (20)
      • 네트워크 (23)
      • AWS Developer BootCamp (3)
  • 블로그 메뉴

    • 홈
    • 태그
    • 방명록
  • 링크

    • 도구모음 사이트
    • 참고 기술 블로그
  • 공지사항

  • 인기 글

  • 태그

    1
  • 최근 댓글

  • 최근 글

  • hELLO· Designed By정상우.v4.10.3
cumo
딥시크 보안, 심각한 구멍...역할극 공격 83% 성공

개인정보

  • 티스토리 홈
  • 포럼
  • 로그인
상단으로

티스토리툴바

단축키

내 블로그

내 블로그 - 관리자 홈 전환
Q
Q
새 글 쓰기
W
W

블로그 게시글

글 수정 (권한 있는 경우)
E
E
댓글 영역으로 이동
C
C

모든 영역

이 페이지의 URL 복사
S
S
맨 위로 이동
T
T
티스토리 홈 이동
H
H
단축키 안내
Shift + /
⇧ + /

* 단축키는 한글/영문 대소문자로 이용 가능하며, 티스토리 기본 도메인에서만 동작합니다.