Atomic Tests vs. Holistic Tests: 새로운 테스트 방법론

들어가며

접근성 테스트라고 하면 보통 체크리스트를 떠올립니다. “이 버튼에 대체 텍스트가 있나?”, “명도 대비는 기준을 넘나?” 같은 질문들이죠. WCAG 2.2는 이런 명확한 통과/실패 판정을 중심으로 작동했습니다.

하지만 WCAG 3.0은 평가의 단위를 더 넓게 보고, 사용자 경험 전체의 품질을 함께 보려는 방향으로 움직이고 있어요. 그래서 테스트 방식도 바뀝니다. 과거의 세밀한 검사(Atomic)와 실제 사용 맥락을 보는 검사(Holistic)를 함께 쓰는 흐름이죠.

이 흐름은 WCAG 3.0 적합성 모델: A/AA/AAA 이후의 변화에서 다룬 점수 기반 적합성 모델과 직접 연결됩니다. 어떤 테스트를 어떤 비중으로 쓸지에 따라 점수와 등급이 달라질 수 있기 때문이에요.

중요: 이 글은 WCAG 3.0 Editor’s Draft(2026-01-05)를 바탕으로 작성되었습니다. Draft는 언제든 변경될 수 있으며, 현재 문서 자체도 Draft가 변경되면 수정될 수 있습니다.

WCAG 2.2의 테스트 방식: 성공 기준 중심

WCAG 2.2는 Success Criteria(성공 기준) 단위로 평가합니다. 각 기준은 “통과/실패”로 판정되며, 특정 레벨(A/AA/AAA)을 모두 만족해야 적합성(Conformance)을 선언할 수 있어요. 또한 평가 범위는 완전한 페이지 집합과 **완전한 프로세스(예: 로그인, 결제)**를 포함해야 합니다.

즉, WCAG 2.2는 다음 특성을 가집니다:

원자적 검사에 강함: 특정 요소나 규칙을 명확히 확인 가능
이분법적 판정: 조금 부족해도 전체 실패로 이어질 수 있음
맥락 반영이 제한적: 사용자 실제 경험의 질은 별도 확인이 필요

이 방식은 자동화 도구와 잘 맞지만, “사용자가 실제로 일을 끝낼 수 있는가?”라는 질문에는 한계가 있어요.

원자적 테스트의 개별 항목 검사 방식은 반복된 체크리스트 같습니다
사진: Unsplash의Jakub Żerdzicki

WCAG 3.0의 테스트 유형 변화

WCAG 3.0은 다양한 테스트 유형을 병행하는 방향을 제안합니다. 최신 Explainer와 Draft 문서에서는 **정량적 테스트(Quantitative)**와 **정성적 테스트(Qualitative)**를 분리해 설명합니다.

정량적 테스트: 반복 가능한 기준, 측정 가능한 결과 중심
정성적 테스트: 사용자 경험, 맥락, 복잡한 상호작용을 고려

여기서 “Atomic Tests vs. Holistic Tests”라는 용어는 2021년 Working Draft에서 사용되었던 표현입니다. Atomic = 정량적/기술적 검사, Holistic = 사용자 경험을 보는 평가로 이해하면 큰 방향은 같습니다.

즉, WCAG 3.0의 흐름은 “모든 걸 점수화”가 아니라, 다층적인 테스트 조합을 통해 결과를 설명하려는 시도에 가깝습니다.

정량 테스트와 정성 테스트가 서로 보완되는 구조를 보여주는 다이어그램 - Atomic과 Holistic의 균형
이미지: Nanobanana AI로 생성

WCAG 3.0에서의 평가 범위: 뷰와 프로세스

WCAG 3.0은 페이지 단위가 아닌 ‘뷰(View)’와 ‘프로세스(Process)’ 개념을 통해 범위를 잡습니다. 이는 웹뿐 아니라 앱, 문서, 복합 시스템까지 포함하기 위한 설계예요.

뷰(View): 사용자가 보는 하나의 화면 단위
프로세스(Process): 여러 뷰가 연결된 사용자 작업 흐름

테스트도 이 단위에 맞춰 구성될 가능성이 큽니다. 그래서 Atomic 테스트는 개별 뷰의 품질, Holistic 테스트는 프로세스 전체의 완성도를 확인하는 역할로 연결됩니다.

WCAG 3.0의 평가 범위를 보여주는 다이어그램 - 개별 뷰와 연결된 프로세스의 관계
이미지: Nanobanana AI로 생성

점수 모델과의 연결: 테스트가 점수를 만든다

WCAG 3.0 적합성 모델: A/AA/AAA 이후의 변화에서 설명했듯이 WCAG 3.0은 점수 기반 모델을 실험하고 있습니다. 이때 점수의 품질은 “어떤 테스트를 했는가”에 크게 좌우됩니다.

Atomic 테스트만 사용하면: 빠르고 일관된 점수는 얻지만, 실제 사용성은 놓칠 수 있음
Holistic 테스트를 포함하면: 사용자 경험을 반영하지만, 평가 비용과 주관성이 늘어남

이 흐름은 한국의 웹접근성 품질인증에서 전문가 심사와 사용자 심사를 나눠 진행하는 방식과 방향성이 닮아 있습니다. 다만 WCAG 3.0은 역할 구분이 아니라 테스트 유형(정량/정성) 구분을 중심으로 설명하고, 점수 기반 적합성 모델을 전제로 한다는 점에서 구조가 다릅니다.

따라서 WCAG 3.0의 핵심은 두 테스트를 조합한 균형점을 찾는 데 있습니다. 이는 조직의 리소스, 제품 특성, 사용자군에 따라 달라질 수 있어요.

마치 저울의 균형을 맞추듯 Atomic 테스트와 Holistic 테스트의 균형점을 찾는 것이 중요합니다.
사진: Unsplash의Myles Bloomfield

실무에서의 의미: 테스트 전략이 바뀐다

WCAG 3.0이 제안하는 변화는 “테스트를 더 많이 하라”가 아니라 테스트의 균형을 바꾸자는 메시지에 가깝습니다.

실무에서는 이렇게 접근하면 좋습니다:

Atomic 테스트로 넓게 검사
- 자동화 도구 + 체크리스트
- 빠르게 범위를 확보
Holistic 테스트로 핵심 흐름 검증
- 실제 사용자 시나리오 테스트
- 대표 작업(가입, 결제, 검색 등) 중심
결과를 설명 가능한 형태로 기록
- 통과/실패가 아니라 “어떤 사용자가 어떤 상황에서 어떤 경험을 하는가”를 기록

이렇게 하면 WCAG 2.2 기반의 기존 감사 프로세스를 버리지 않고, WCAG 3.0의 방향성도 함께 반영할 수 있어요.

테스트 전략의 균형을 조직에 맞게 조정하는게 중요합니다. 마치 화이트보드 앞에서 전략을 고민하듯 말이죠.
사진: Unsplash의Christina @ wocintechchat.com M

정리하며

WCAG 2.2는 명확한 규칙 기반 평가에 강했고, WCAG 3.0은 실제 사용성까지 포함하는 평가를 강화하려고 합니다. 그 차이를 가장 잘 보여주는 변화가 바로 Atomic 테스트와 Holistic 테스트의 병행이에요.

다음 글에서는 Assertions가 점수 모델에서 어떤 역할을 하며, Foundational/Supplemental Requirements와 어떻게 결합되는지 더 구체적으로 살펴보겠습니다.

주의 사항: 이 글은 2026-01-05 WCAG 3.0 Editor’s Draft를 기준으로 작성되었습니다. WCAG 3.0은 아직 개발 중이며, 최종 권고안 이전까지 내용이 변경될 수 있습니다. 특히 적합성 모델은 확정되지 않았으므로 최신 W3C 문서를 확인하시기 바랍니다.

들어가며#

WCAG 2.2의 테스트 방식: 성공 기준 중심#

WCAG 3.0의 테스트 유형 변화#

WCAG 3.0에서의 평가 범위: 뷰와 프로세스#

점수 모델과의 연결: 테스트가 점수를 만든다#

실무에서의 의미: 테스트 전략이 바뀐다#

정리하며#