샤딩의 핵심 내용은?

샤딩은(는) EBS 수능특강 독서 과학기술 작품입니다. 김은광 수능국어에서 지문 읽기, 구조 분석, OX 퀴즈, 수능형 문제풀이를 인터랙티브로 학습할 수 있습니다.

샤딩 수능 출제 포인트는?

샤딩의 수능 출제 포인트와 EBS 연계 분석은 회원가입 후 무료로 확인할 수 있습니다. 수능 국어 만점 강사가 직접 분석한 연계 포인트, 화자·서술자 분석, 표현법 정리를 제공합니다.

샤딩 문제풀이는 어디서 할 수 있나요?

ekkorean.com에서 샤딩의 OX 퀴즈, 내신형 문제, 수능형 문제를 즉시 채점과 함께 풀 수 있습니다. 무료 회원가입 후 모든 기능을 이용할 수 있습니다.

샤딩 분석·변형문제 | 2027 수능특강 과학기술

작품 정보

카테고리

과학기술

📊

회원가입하고 문제를 풀면?

OX 퀴즈 결과를 자동 분석해서 매주 주간 학습 리포트와 취약부분 맞춤 보강 문제를 보내드려요.

이메일 가입

샤딩 원문 · 구조 분석

독서 과학기술 13 | 샤딩 적용 학습 · 과학·기술 과학기술 13 샤딩 과학·기술 — 컴퓨터과학(분산 파일 관리) | 설명형 지문읽기 구조분석 문제풀기 연계포인트 지문 분야: 과학·기술(컴퓨터과학/분산 시스템) | 주제: 샤딩의 개념과 실행 방법 | 유형: 설명형 | 문단: 4문단 | 수능특강: 219~221p 1 개별적이고 특수한 작업을 수행하는 여러 대의 클라이언트 클라이언트: 서버 시스템과 연결하여 주된 작업이나 정보를 서버에 요청하고 그 결과를 돌려받는 컴퓨터 시스템. 와 연결되어 정보나 서비스를 제공하는 컴퓨터 시스템을 서버 서버: 클라이언트의 요청에 따라 작업을 수행하거나 정보를 검색하고 그 결과를 클라이언트에 돌려주는 컴퓨터 시스템. 라고 한다. 서버는 클라이언트의 요청에 따라 작업을 수행하거나 정보를 검색하고, 그 결과를 클라이언트에 돌려준다. 서버를 구성하는 기계에서 작업을 신속하고 정확하게 처리하기 위해서는 데이터를 안전하게 관리해야 할 뿐 아니라 신속하게 데이터에 접근하여 데이터의 읽기나 쓰기를 실행할 필요가 있다. 이런 필요를 충족시키기 위해 개발된 것이 ㉠ 분산 파일 관리 체계 분산 파일 관리 체계: 다수의 기계에 데이터를 나누어 저장·관리하는 시스템. 데이터의 불법 변조 방지, 유실 방지, 서버 부하 감소를 도모한다. 이다. 분산 파일 관리 체계 분산 파일 관리 체계: 다수의 기계에 데이터를 분산하여 불법 변조 방지, 유실 방지, 부하 분산 등을 구현하는 전략. 는 데이터의 불법 변조 불법 변조: 허가 없이 데이터를 불법적으로 변경하는 것. 분산 파일 관리 체계는 이를 방지하는 데 유리하다. 를 방지하고, 기계적 결함에 대응하여 데이터의 유실로부터 안전을 도모하며, 서버의 부하 서버의 부하: 서버가 처리해야 하는 작업의 양. 분산 파일 관리 체계는 부하를 여러 기계에 분산시켜 줄인다. 를 줄여 신속한 연산을 수행하도록 기계적 성능과 저장 용량을 확보하는 데 유리한 전략이다. 단일 기계로 구성된 서버에서 데이터를 관리할 경우에는 하드웨어적으로 램 램(RAM): 데이터가 저장되어 있는 위치에 관계없이 일정한 시간 내에 기억 내용을 읽거나 쓸 수 있는 기억 장치. 컴퓨터의 주기억 장치로서 널리 이용됨. 이나 CPU CPU: 컴퓨터 시스템 전체의 작동을 통제하고 프로그램의 모든 연산을 수행하는 가장 핵심적인 장치. 제어 장치와 연산 장치로 이루어져 있음. 의 성능이 우수한 기계를 확보하는 데 큰 비용이 들지만, 분산 파일 관리 체계에서는 다수의 저성능 기계 저성능 기계: 램이나 CPU 성능이 낮은 저렴한 기계. 분산 파일 관리 체계에서는 이를 여러 대 연결해 고성능을 구현한다. 를 연결하여 데이터를 관리함으로써 비용을 절감하면서도 높은 수준의 성능을 확보할 수 있다. 그뿐만 아니라 기계가 고장이 나더라도 데이터가 여러 기계에 분산되어 있으면 고장 나지 않은 기계에 있는 데이터는 안전하고, 해킹을 당하더라도 해커에게 단일 서버에 접근하여 단번에 필요한 데이터 전체를 탈취하지 못하고 여러 기계를 뚫어야 하는 어려움을 줌으로써 피해를 줄일 수 있는 장점이 있다. 2 ㉡ 샤딩 샤딩(sharding): 분산 파일 관리 체계 중 하나. 데이터를 샤드 단위로 분할하여 서로 연결된 기계들에 나누어 저장하고 활용하는 방법. (sharding)은 분산 파일 관리 체계 중 하나로서 데이터를 샤드 샤드(shard): 샤딩에서 관리하기 쉽도록 분할한 후 서로 연결된 기계들에 나누어 저장한 데이터 세트. 단위로 분할하여 저장하고 활용하는 방법이다. 샤드(shard)란 관리하기 쉽도록 분할한 후 서로 연결된 기계들에 나누어 저장한 데이터 세트 데이터 세트: 관련 있는 데이터의 집합. 샤딩에서는 이를 여러 샤드로 분할하여 저장한다. 를 의미한다. 샤딩을 운용하려면 클라이언트의 요청이 들어왔을 때 어떤 샤드에 해당 데이터가 저장되어 있는지를 판별하고, 그 샤드에서 필요한 데이터를 조회해서 클라이언트에 전달하는 라우터 라우터(router): 샤딩에서 어떤 샤드에 데이터가 있는지 판별하고, 그 샤드에서 필요한 데이터를 조회해 클라이언트에 전달하는 역할을 담당하는 구성 요소. 가 필요하다. 라우터가 이런 역할을 수행할 수 있도록 전체 샤드의 분할 정보 분할 정보: 전체 데이터가 어떻게 샤드로 나뉘어 있는지에 대한 정보. 설정 서버에 저장·관리된다. 와 위치 정보 위치 정보: 각 샤드가 어떤 기계에 저장되어 있는지에 대한 정보. 설정 서버에 저장·관리된다. 를 저장하고 관리하는 설정 서버 설정 서버: 샤딩에서 전체 샤드의 분할 정보, 위치 정보, 로그 정보를 저장하고 관리하는 별도의 서버. 가 별도로 마련되어 있다. 또한 설정 서버에는 나중에 필요한 상황이 되었을 때 사용할 수 있도록 각각의 샤드가 어떻게 이용되었는지를 보여 주는 로그 정보 로그 정보: 각각의 샤드가 어떻게 이용되었는지 기록한 정보. 설정 서버에 저장되어 나중에 필요할 때 활용할 수 있다. 가 저장되기도 한다. 샤딩을 운용하면 저장소 분산 저장소 분산: 샤딩을 통해 저장 용량이 큰 고가의 기계 대신 저장 용량이 작은 저가의 기계를 여러 개 합쳐서 동일 저장 용량을 확보하는 것. 비용 절감 효과가 있다. 과 부하 분산 부하 분산: 샤딩을 통해 데이터의 쓰기, 읽기 및 연산을 각 샤드마다 다른 기계가 분산하여 처리하게 하는 것. 신속한 작업 수행을 가능하게 한다. 의 유익을 볼 수 있다. 저장소 분산은 샤딩을 통해 저장 용량이 큰 고가의 기계 대신에 저장 용량이 작은 저가의 기계를 여러 개 합쳐서 동일 저장 용량을 확보하는 것인데, 이때 일반적으로 비용 절감의 효과를 볼 수 있다. 부하 분산은 샤딩을 통해 데이터의 쓰기, 읽기 및 연산을 각 샤드마다 다른 기계가 분산하여 처리하게 하는 것인데, 이는 신속하게 작업을 수행할 수 있게 해 주는 장점이 있다. 3 샤딩의 약점 중 하나는 연산에 활용해야 할 데이터가 여러 샤드에 흩어져 있을 경우에 그것을 끌어모아 처리하는 데 시간 지연이 발생하는 상황인 성능 병목 현상 성능 병목 현상: 연산에 필요한 데이터가 여러 샤드에 흩어져 있을 때 그것을 끌어모아 처리하는 과정에서 발생하는 시간 지연 상황. 이 나타날 수 있다는 점이다. 저성능 기계 간의 통신에서 발생하는 지연이 하나의 기계에서 통합적으로 연산을 수행하느라 유발되는 부하로 인한 지연보다 더 클 수 있다. 따라서 하나의 요청에 의해 액세스되는 데이터들은 가능하면 하나의 샤드에 배분되도록 설계하여 데이터 지역성 데이터 지역성(data locality): 관련 데이터를 가능한 한 하나의 샤드에 모아 두는 설계 원칙. 데이터 지역성을 확보하는 것이 샤딩 성능을 높이는 핵심적인 방법이다. 을 확보하는 것이 샤딩 성능을 높이는 핵심적인 방법이다. 샤딩이 갖는 또 다른 약점은 샤드마다 다른 데이터가 들어 있기 때문에 데이터의 불법적 변조나 기계적 에러가 발생할 경우 복구하기가 용이하지 않기에 ㉢ 장애 허용성 장애 허용성(fault tolerance): 데이터에 이상이 발생해도 복구할 수 있는 대응 능력. 샤딩은 샤드마다 다른 데이터가 저장되어 장애 허용성이 낮다. 이 낮다는 것이다. 이 문제를 해결하는 방법은 ⓐ샤딩에 복제 복제(replication): 샤딩과 달리 각기 다른 기계에 같은 내용의 데이터를 저장하는 분산 방법. 장애 허용성을 높이기 위해 샤딩과 결합하여 사용한다. 를 결합하는 것이다. 복제는 샤딩과 달리 각기 다른 기계에 같은 내용의 데이터를 저장하는 분산 방법이다. 데이터의 불법 변조나 결함이 발생했을 때 정상적인 데이터를 다른 기계가 복제본 복제본: 원본 데이터 세트를 그대로 복사하여 저장한 것. 에러 발생 시 복제본으로부터 정상 데이터를 복구할 수 있다. 으로 가지고 있어서 에러를 복구할 수 있게 하여 장애 허용성을 확보하는 것이다. 복제에서는 클라이언트의 읽기 요청을 서버가 복제본에서 분산하여 처리할 수 있는 반면, 데이터의 추가, 수정, 삭제와 같은 쓰기 작업 쓰기 작업: 데이터의 추가, 수정, 삭제 등의 작업. 복제에서 쓰기 작업은 원본과 모든 복제본에 일관되게 적용되어야 하므로 속도가 느려질 수 있다. 은 원본이나 복제본에서 단독으로 이루어지면 안 되고 원본과 모든 복제본에 일관되게 적용되어야 하기 때문에 연산 속도가 느려지는 문제가 발생할 수 있다. 샤딩에 복제를 결합하는 한 가지 예를 들어 보자. 기계 A, B, C, D가 있을 때, 샤딩에 따라 A, B, C, D에 다른 내용의 샤드 s1, s2, s3, s4를 각각 저장하고, 복제에 따라 샤드 s1을 A에 저장할 뿐 아니라 B에도 s1의 복제본 s1′을 저장하여 B에는 내용이 다른 원본 샤드 s2와 복제본 샤드 s1′을 함께 저장한다. 같은 방식으로 C에는 s3, s2′, D에는 s4, s3′, A에는 s1, s4′을 저장한다. s2′, s3′, s4′은 각각 s2, s3, s4의 복제본이다. 이렇게 하면 어떤 샤드에서 에러가 발생했을 때 에러가 발생하지 않은 그 샤드의 복제본으로부터 정상적인 데이터를 넘겨받아 에러를 수정할 수 있고, 어떤 샤드에 읽기 요청이 쇄도하면 다른 기계에 있는 그 샤드의 복제본에서 처리될 수 있게 부하를 분산할 수 있다. 4 샤딩에 복제를 결합한다고 해도 기계와 기계의 연결 과정에서 발생하는 시간 지연 때문에 데이터 일관성 데이터 일관성: 모든 기계에 저장된 데이터가 항상 동일한 상태를 유지하는 성질. 샤딩+복제 결합 시에도 일시적으로 깨질 수 있다. 이 일시적으로 ㉮깨지는 문제를 완전히 극복할 수는 없다. 따라서 신속하고 정확하며 저렴하게 데이터를 송수신·저장·처리하는 기술상의 발전이 요청된다. 또한 데이터의 활용 방식이나 범위의 변화에 따라 적합한 데이터 관리 시스템을 지속적으로 모색해 나갈 필요가 있다. *클라이언트: 서버 시스템과 연결하여 주된 작업이나 정보를 서버에 요청하고 그 결과를 돌려받는 컴퓨터 시스템. *램: 데이터가 저장되어 있는 위치에 관계없이 일정한 시간 내에 기억 내용을 읽거나 쓸 수 있는 기억 장치. 컴퓨터의 주기억 장치로서 널리 이용됨. *CPU: 컴퓨터 시스템 전체의 작동을 통제하고 프로그램의 모든 연산을 수행하는 가장 핵심적인 장치. 제어 장치와 연산 장치로 이루어져 있음. 핵심 어휘 (30개) 어휘 의미 클라이언트 서버 시스템과 연결하여 작업이나 정보를 서버에 요청하고 결과를 돌려받는 컴퓨터 시스템 서버 클라이언트의 요청에 따라 작업을 수행하거나 정보를 검색하고 결과를 제공하는 컴퓨터 시스템 분산 파일 관리 체계 데이터를 여러 기계에 나누어 저장·관리하는 시스템. 불법 변조 방지·유실 방지·부하 감소에 유리 불법 변조 허가 없이 데이터를 불법적으로 변경하는 것 서버의 부하 서버가 처리해야 하는 작업의 양. 분산을 통해 줄일 수 있다 램(RAM) 저장 위치와 무관하게 일정 시간 내에 읽기·쓰기 가능한 주기억 장치 CPU 컴퓨터 전체의 작동을 통제하고 연산을 수행하는 핵심 장치 샤딩(sharding) 데이터를 샤드 단위로 분할하여 여러 기계에 나누어 저장·활용하는 분산 파일 관리 방법 샤드(shard) 관리하기 쉽도록 분할한 후 여러 기계에 나누어 저장한 데이터 세트 데이터 세트 관련 있는 데이터의 집합 라우터 어떤 샤드에 데이터가 있는지 판별하고 해당 샤드에서 데이터를 조회해 클라이언트에 전달하는 구성 요소 분할 정보 전체 데이터가 어떻게 샤드로 나뉘어 있는지에 대한 정보. 설정 서버에 저장 위치 정보 각 샤드가 어느 기계에 저장되어 있는지에 대한 정보. 설정 서버에 저장 설정 서버 샤딩에서 분할 정보, 위치 정보, 로그 정보를 저장·관리하는 별도 서버 로그 정보 각 샤드가 어떻게 이용되었는지 기록한 정보. 설정 서버에 저장 저장소 분산 저가의 기계 여러 개를 합쳐 동일 저장 용량을 확보하는 것. 비용 절감 효과 부하 분산 쓰기·읽기·연산을 각 샤드마다 다른 기계가 분산 처리하게 하는 것 성능 병목 현상 데이터가 여러 샤드에 흩어져 있을 때 끌어모아 처리하는 데 발생하는 시간 지연 데이터 지역성 관련 데이터를 하나의 샤드에 모아 두는 설계 원칙. 샤딩 성능 향상의 핵심 장애 허용성 데이터에 이상이 발생해도 복구할 수 있는 대응 능력 복제 각기 다른 기계에 같은 내용의 데이터를 저장하는 분산 방법. 장애 허용성 확보에 사용 복제본 원본 데이터 세트를 복사하여 저장한 것 쓰기 작업 데이터의 추가·수정·삭제. 복제에서 원본과 모든 복제본에 일관 적용 필요 데이터 일관성 모든 기계의 데이터가 항상 동일한 상태를 유지하는 성질 마스터 마스터 슬레이브 방법에서 원본 데이터 세트. 쓰기 요청은 마스터에서만 처리 슬레이브 마스터 슬레이브 방법에서 복제본 데이터 세트. 읽기 요청 처리 가능 피어(peer) 피어 투 피어 방법에서 원본과 복제본을 구분하지 않고 대등하게 취급하는 데이터 세트 마스터 슬레이브 원본(마스터)과 복제본(슬레이브)을 구분하여 취급하는 복제 방법 피어 투 피어 원본과 복제본을 구분하지 않고 모두 피어로 취급하는 복제 방법 저성능 기계 램·CPU 성능이 낮은 저렴한 기계. 분산 파일 관리 체계에서 다수를 연결해 사용 배경지식 — 샤딩의 개념과 분산 시스템 ▼ 해제: 이 글의 핵심 이 글은 분산 파일 관리 체계의 일종인 샤딩 에 대해 설명하고 있다. 분산 파일 관리 체계는 다수의 저렴한 저성능 기계를 연결하여 비용과 성능 면에서 이득을 도모하는 다양한 장점이 있다. 샤딩은 데이터를 샤드 단위로 분할하여 라우터와 설정 서버를 통해 운용하며, 저장소 분산과 부하 분산의 장점이 있다. 그러나 성능 병목 현상과 낮은 장애 허용성이 약점이며, 복제와 결합하면 장애 허용성 문제를 줄일 수 있다. 다만 샤딩과 복제를 결합해도 데이터 일관성이 일시적으로 깨지는 문제는 완전히 극복할 수 없다. 서버-클라이언트 구조 기본 개념 현대 컴퓨터 네트워크에서 서버는 데이터와 서비스를 제공하고, 클라이언트는 이를 요청하여 활용한다. 데이터 양이 폭발적으로 증가하면서 단일 서버로는 처리가 어려워졌고, 이를 해결하기 위해 분산 시스템이 등장하였다. 분산 시스템에는 샤딩, 복제, 클러스터링 등 다양한 방법이 있다. 샤딩과 복제의 차이 샤딩 은 데이터를 나누어 여러 기계에 저장한다(각 기계에는 다른 데이터). 복제 는 데이터를 똑같이 여러 기계에 저장한다(각 기계에는 같은 데이터). 샤딩은 저장소 분산과 부하 분산에 유리하고, 복제는 장애 허용성 확보에 유리하다. 실제로는 두 방법을 결합하여 사용한다. 마스터 슬레이브 vs 피어 투 피어 복제를 구현할 때 원본과 복제본을 구분하면 마스터 슬레이브 방법, 구분하지 않으면 피어 투 피어 방법이다. 마스터 슬레이브 방법에서는 쓰기 요청이 마스터에서만 처리되어 슬레이브로 복제된다. 피어 투 피어 방법에서는 읽기·쓰기 모두 바쁘지 않은 피어에서 처리되고, 수정된 데이터는 다른 피어로 복제된다. 두 방법 모두 기계 간 연결 과정에서 데이터 일관성이 일시적으로 깨질 수 있다. ✎ 구조 분석 지문 유형 & 전개 방식 유형 설명형 — 분산 파일 관리 체계(샤딩)의 개념, 구현 방법, 장단점, 개선 방향을 순서대로 전개한다. 전개 방식 개념 도입 → 구현 방법 → 약점과 해결 방법 → 한계와 개선 방향 (문제-해결 구조 반복) 대비 구조 샤딩 (데이터 분할, 저장소·부하 분산, 장애 허용성 낮음) vs 복제 (데이터 동일 저장, 장애 허용성 높음, 쓰기 속도 느림) 핵심 개념 분산 파일 관리 체계 → 샤딩 → 라우터·설정 서버 → 저장소 분산·부하 분산 → 성능 병목·장애 허용성 → 복제 결합 → 데이터 일관성 문제 문단별 중심 내용 문단 핵심 내용 문단 역할 ① 분산 파일 관리 체계의 개념과 장점: 불법 변조 방지, 유실 방지, 부하 감소 / 저렴한 저성능 기계로 비용 절감 + 고성능 구현 화제 도입 ② 샤딩의 구현: 샤드 단위 분할 / 라우터(판별+전달) / 설정 서버(분할 정보+위치 정보+로그 정보) / 저장소 분산+부하 분산 장점 핵심 개념 1 ③ 샤딩의 약점: 성능 병목 현상(데이터 지역성 확보로 극복) / 낮은 장애 허용성(복제와 결합으로 극복) / 복제의 특성과 샤딩+복제 결합 예시 약점과 해결 ④ 한계와 개선 방향: 샤딩+복제 결합 후에도 데이터 일관성 일시 붕괴 / 기술적 발전 필요 / 적합한 시스템 지속 모색 한계 + 마무리 TIP 1. 라우터와 설정 서버의 역할 구분 라우터: 어떤 샤드에 데이터가 있는지 판별 → 데이터 조회 → 클라이언트에 전달. 설정 서버: 분할 정보+위치 정보+로그 정보를 저장·관리. 라우터가 설정 서버의 정보를 활용하여 역할을 수행한다. 두 역할이 뒤바뀐 선지에 주의. 논리 흐름도 ① 분산 파일 관리 체계 → 불법 변조 방지 / 유실 방지 / 부하 감소 / 비용 절감 ↓ ② 샤딩 구현 → 샤드 분할 / 라우터(판별+전달) / 설정 서버(정보 관리) / 저장소·부하 분산 ↓ ③ 약점 극복 → 성능 병목(데이터 지역성 확보) / 장애 허용성(복제와 결합) ↓ ④ 한계와 과제 → 데이터 일관성 일시 붕괴 완전 극복 불가 → 기술 발전 필요 핵심 포인트 5 Point 1. 분산 파일 관리 체계의 세 가지 기능 ① 불법 변조 방지 : 데이터가 여러 기계에 분산되어 해킹 시 전체 탈취가 어렵다. ② 유실 방지 : 기계 고장 시 다른 기계의 데이터는 안전. ③ 부하 감소 : 여러 기계에서 연산을 분산 처리. 또한 저렴한 저성능 기계 여러 대를 연결해 비용을 절감하면서 고성능을 구현한다. Point 2. 샤딩 운용 구조: 라우터와 설정 서버 라우터 : 클라이언트 요청 수신 → 어떤 샤드에 데이터가 있는지 판별 → 해당 샤드에서 데이터 조회 → 클라이언트에 전달. 설정 서버 : 분할 정보·위치 정보·로그 정보 저장·관리(라우터의 역할 지원). 라우터가 클라이언트가 아닌 서버에 전달한다는 선지는 오답이다. Point 3. 저장소 분산 vs 부하 분산 저장소 분산 : 저가의 소용량 기계 여러 개로 동일 저장 용량 확보 → 비용 절감. 부하 분산 : 쓰기·읽기·연산을 각 샤드마다 다른 기계가 처리 → 신속한 작업 수행. 두 효과 모두 샤딩을 통해 얻는다. Point 4. 성능 병목 현상과 데이터 지역성 성능 병목 현상 : 데이터가 여러 샤드에 흩어져 있을 때 끌어모으는 시간 지연. 저성능 기계 간 통신 지연이 단일 기계 부하 지연보다 더 클 수 있다. 해결책: 데이터 지역성 확보 = 관련 데이터를 하나의 샤드에 모아 두는 설계. 이것이 샤딩 성능 향상의 핵심이다. Point 5. 샤딩과 복제의 결합과 한계 샤딩의 약점인 낮은 장애 허용성을 복제로 보완. 복제: 각기 다른 기계에 같은 내용 저장 → 에러 시 복구 가능. 읽기: 복제본에서 분산 처리 가능. 쓰기: 원본+모든 복제본에 일관 적용 필요 → 속도 저하. 결합 후에도 기계 간 시간 지연 때문에 데이터 일관성 일시 붕괴를 완전 극복 불가 . TIP 2. 복제에서 읽기 vs 쓰기 구분 읽기 요청 → 복제본에서 분산 처리 가능(부하 분산 OK). 쓰기 작업 → 원본과 모든 복제본에 일관 적용 필요 → 속도 저하. 이 차이를 혼동하는 선지가 빈출이다. 핵심 개념 카드 (5개) 샤딩(sharding) 분산 파일 관리 체계의 한 종류. 데이터를 샤드 단위로 분할하여 서로 연결된 기계들에 나누어 저장하고 활용하는 방법이다. 저장소 분산과 부하 분산의 장점이 있으나 성능 병목 현상과 낮은 장애 허용성이 약점이다. 라우터와 설정 서버 라우터: 클라이언트 요청이 들어오면 해당 데이터가 어떤 샤드에 있는지 판별하고 그 샤드에서 데이터를 조회해 클라이언트에 전달하는 역할. 설정 서버: 전체 샤드의 분할 정보·위치 정보·로그 정보를 저장·관리하여 라우터의 역할 수행을 지원. 성능 병목 현상과 데이터 지역성 성능 병목 현상: 데이터가 여러 샤드에 흩어져 있을 때 끌어모아 처리하는 과정의 시간 지연. 데이터 지역성: 하나의 요청에 의해 액세스되는 데이터들을 하나의 샤드에 집중 배분하는 설계 원칙. 데이터 지역성 확보가 샤딩 성능 향상의 핵심이다. 복제(replication) 샤딩과 달리 각기 다른 기계에 같은 내용의 데이터를 저장하는 분산 방법. 데이터의 불법 변조나 결함이 발생해도 복제본으로 복구가 가능하여 장애 허용성을 높인다. 읽기는 복제본에서 분산 처리 가능, 쓰기는 원본과 모든 복제본에 일관 적용 필요. 데이터 일관성 모든 기계에 저장된 데이터가 항상 동일한 상태를 유지하는 성질. 샤딩과 복제를 결합해도 기계 간 연결 과정에서 발생하는 시간 지연 때문에 데이터 일관성이 일시적으로 깨지는 문제를 완전히 극복할 수 없다. 샤딩 vs 복제 비교 구분 샤딩(sharding) 복제(replication) 데이터 저장 방식 각 기계에 다른 내용 저장 각 기계에 같은 내용 저장 주요 장점 저장소 분산 + 부하 분산 장애 허용성 확보 주요 약점 성능 병목 / 낮은 장애 허용성 쓰기 속도 저하 읽기 처리 해당 샤드에서 처리 복제본에서 분산 처리 가능 쓰기 처리 해당 샤드에서 처리 원본+모든 복제본에 일관 적용 ✔ 문제풀기 내 점수 0 / 0 OX 확인 문제 — 기본 (1~7) 1. 기본 분산 파일 관리 체계는 데이터의 불법 변조를 방지하고 기계적 결함에 대응하여 데이터 유실로부터 안전을 도모하는 데 유리하다. O X 2. 기본 샤딩에서 라우터는 어떤 샤드에 해당 데이터가 저장되어 있는지를 판별하고 그 샤드에서 필요한 데이터를 조회해서 클라이언트에 전달한다. O X 3. 기본 설정 서버에는 전체 샤드의 분할 정보와 위치 정보가 저장·관리된다. O X 4. 기본 샤딩의 부하 분산은 데이터의 쓰기, 읽기 및 연산을 각 샤드마다 다른 기계가 분산하여 처리하게 하는 것이다. O X 5. 기본 복제는 샤딩과 달리 각기 다른 기계에 같은 내용의 데이터를 저장하는 분산 방법이다. O X 6. 기본 분산 파일 관리 체계에서는 다수의 저렴한 저성능 기계를 연결하여 비용을 절감하면서도 높은 수준의 성능을 확보할 수 있다. O X 7. 기본 샤딩의 약점 중 하나는 장애 허용성이 낮다는 것으로, 이는 샤드마다 다른 데이터가 들어 있기 때문이다. O X OX 확인 문제 — 심화 (8~14) 8. 심화 데이터 지역성을 확보하는 것은 샤딩에서 성능 병목 현상을 줄이는 핵심적인 방법이다. O X 9. 심화 복제에서 클라이언트의 읽기 요청은 복제본에서 분산하여 처리할 수 있다. O X 10. 심화 샤딩과 복제를 결합하면 어떤 샤드에서 에러가 발생했을 때 그 샤드의 복제본으로부터 정상적인 데이터를 받아 에러를 수정할 수 있다. O X 11. 심화 저장소 분산은 저장 용량이 작은 저가의 기계를 여러 개 합쳐서 고가의 기계 한 대와 동일한 저장 용량을 확보하여 비용을 절감하는 방법이다. O X 12. 심화 설정 서버에는 분할 정보와 위치 정보뿐 아니라 각 샤드의 이용 내역을 보여 주는 로그 정보도 저장될 수 있다. O X 13. 심화 샤딩에 복제를 결합할 때, 기계 B에 원본 샤드 s2와 복제본 샤드 s1′이 함께 저장되는 것은 한 기계에 내용이 다른 샤드들이 존재하는 사례이다. O X 14. 심화 복제에서 쓰기 작업은 원본이나 복제본에서 단독으로 이루어지지 않고 원본과 모든 복제본에 일관되게 적용되어야 하므로 연산 속도가 느려질 수 있다. O X OX 확인 문제 — 고난도 (15~20) 모두 X 15. 고난도 라우터는 전체 샤드의 분할 정보와 위치 정보를 저장하고 관리하여 설정 서버가 데이터를 클라이언트에 전달할 수 있도록 지원한다. O X 16. 고난도 성능 병목 현상은 데이터가 하나의 샤드에 집중되어 처리 용량을 초과할 때 발생하며, 이를 해결하기 위해 데이터를 여러 샤드에 분산 배치해야 한다. O X 17. 고난도 복제에서 쓰기 작업은 원본 또는 복제본 중 어느 하나에서만 처리하고, 이후 다른 기계들이 동기화하는 방식으로 진행되어 빠른 쓰기 속도를 보장한다. O X 18. 고난도 샤딩에 복제를 결합하면 데이터 일관성이 일시적으로 깨지는 문제를 완전히 극복할 수 있어 추가적인 기술 발전이 필요하지 않다. O X 19. 고난도 분산 파일 관리 체계에서는 반드시 고성능 기계를 사용해야 하므로 단일 기계 서버보다 비용이 항상 더 많이 든다. O X 20. 고난도 샤딩의 저장소 분산을 통해 비용을 절감하려면 반드시 저장 용량이 큰 고가의 기계를 다수 확보해야 하며, 저가의 기계만으로는 동일 저장 용량을 확보할 수 없다. O X 함정특강 1. 라우터 vs 설정 서버 역할 뒤바꿈 정보를 저장·관리하는 것은 설정 서버이고, 판별·조회·전달을 하는 것은 라우터이다. ox15처럼 라우터가 정보를 저장·관리하고 설정 서버가 전달한다는 진술은 역할이 완전히 뒤바뀐 거짓 진술이다. 설정 서버의 정보를 라우터가 활용하는 구조임을 기억할 것. 함정특강 2. 성능 병목 현상의 원인 왜곡 성능 병목 현상은 데이터가 여러 샤드에 흩어져 있을 때 그것을 끌어모으는 과정에서 발생한다. ox16처럼 데이터가 하나의 샤드에 집중될 때 발생한다고 서술하면 원인이 정반대로 뒤바뀐 것이다. 해결책도 데이터를 분산 배치하는 것이 아니라 반대로 하나의 샤드에 모으는 데이터 지역성 확보이다. 함정특강 3. 범위 변조와 조건 왜곡 ox18처럼 “완전히 극복할 수 있어 추가 발전이 필요 없다”는 진술은 지문의 내용과 반대이다. 지문에서는 샤딩+복제를 결합해도 데이터 일관성 문제를 완전히 극복할 수 없다고 명시하였다. ox19처럼 “반드시 고성능 기계”나 ox20처럼 “반드시 고가의 기계 다수 확보” 등의 과잉 일반화 진술도 주의할 것. 수능형 문제 1 ㉠에 대한 설명으로 적절하지 않은 것은? ① 한 대의 고성능 기계보다는 여러 대의 저성능 기계를 연결하여서 저렴하게 고성능을 발휘하게 할 수 있다. ② 여러 대의 기계에 데이터를 분산시켜 놓아서 하나의 기계에 결함이 생겨도 다른 기계는 정상 작동할 수 있다. ③ 하나의 기계에서 연산을 모두 수행하기보다 여러 대의 기계에서 분산하여 연산을 수행할 수 있어 효율적이다. ④ 해커가 침입하여 데이터를 불법적으로 탈취할 경우에 데이터가 여러 대의 기계에 분산되어 있어 피해를 줄일 수 있다. ⑤ 저성능 기계 간의 통신에서 발생하는 지연은 하나의 기계에서 통합적으로 연산을 수행하느라 유발되는 부하로 인한 지연보다 짧다는 점에서 유리하다. 출제 의도 — 세부 내용 파악 분산 파일 관리 체계(㉠)에 대한 세부 내용의 일치 여부를 판단한다. 선지 분석 ① 일치 — 1문단: 분산 파일 관리 체계에서는 다수의 저렴한 저성능 기계를 연결하여 비용을 절감하면서도 높은 수준의 성능을 확보할 수 있다. ② 일치 — 1문단: 기계가 고장이 나더라도 데이터가 여러 기계에 분산되어 있으면 고장 나지 않은 기계에 있는 데이터는 안전하다. ③ 일치 — 1문단에서 서버의 부하를 줄여 신속한 연산을 수행하도록 기계적 성능을 확보한다고 하였고, 2문단에서 부하 분산으로 각 샤드마다 다른 기계가 분산 처리한다고 하였다. ④ 일치 — 1문단: 해킹을 당하더라도 여러 기계를 뚫어야 하는 어려움을 줌으로써 피해를 줄일 수 있다. ⑤ 부적절 (정답) — 3문단에서 저성능 기계 간의 통신에서 발생하는 지연이 하나의 기계에서 통합적으로 연산을 수행하느라 유발되는 부하로 인한 지연보다 더 클 수 있다 고 하였다. 이는 샤딩의 약점으로 제시된 것이다. 함정 해부 [조건 왜곡] 지문에서 저성능 기계 간 통신 지연이 단일 기계 부하 지연보다 클 수 있다고 하였는데, 선지는 이를 반대로 서술하였다. 2 ㉡에 대해 설명한 내용으로 적절하지 않은 것은? ① 분산 파일 관리 체계의 한 종류이다. ② 데이터를 관리하기 용이한 크기로 분할하여 다른 기계에 저장한다. ③ 필요한 경우 샤드의 이용 내역을 담은 로그 정보를 저장하는 곳은 설정 서버이다. ④ 샤드에 분산된 데이터의 위치를 파악하여 요청에 대응하기 위한 체계가 필요하다. ⑤ 라우터는 클라이언트의 요청에 따라 샤드에서 데이터를 조회해서 서버에 전달한다. 출제 의도 — 세부 내용 파악 샤딩(㉡)의 구현 방법에 대한 세부 내용의 일치 여부를 판단한다. 선지 분석 ① 일치 — 2문단: 샤딩은 분산 파일 관리 체계 중 하나이다. ② 일치 — 2문단: 샤드는 관리하기 쉽도록 분할한 후 서로 연결된 기계들에 나누어 저장한 데이터 세트이다. ③ 일치 — 2문단: 설정 서버에는 각각의 샤드가 어떻게 이용되었는지를 보여 주는 로그 정보가 저장되기도 한다. ④ 일치 — 2문단: 라우터가 분할 정보와 위치 정보를 통해 어떤 샤드에 데이터가 있는지 판별하는 체계가 필요하다. ⑤ 부적절 (정답) — 2문단에서 라우터는 샤드에서 필요한 데이터를 조회해서 클라이언트 에 전달한다고 하였다. 서버가 아니라 클라이언트에 전달하는 것이다. 함정 해부 [비교 혼동] 라우터의 전달 대상을 서버로 바꾼 것. 라우터는 클라이언트에 전달한다. 3 ㉢의 의미를 추론한 내용으로 가장 적절한 것은? ① 데이터에 결함이 생기지 않도록 방지하는 능력 ② 해킹과 같은 공격에 대비하여 마련한 보안 대책 ③ 데이터에 이상이 발생해도 복구할 수 있는 대응 능력 ④ 완전하지 않은 데이터라도 받아들여서 향후 사용을 위해 준비한 상태 ⑤ 기능을 수행할 수 없는 데이터를 모아서 기능을 수행할 수 있도록 변환하는 능력 출제 의도 — 생략된 내용 추론 ㉢(장애 허용성)의 의미를 지문의 맥락에서 추론할 수 있는지 변별한다. 선지 분석 ① 부적절 — 결함이 생기지 않도록 방지하는 것은 장애 허용성이 아니다. 장애 허용성은 결함이 발생했을 때 복구할 수 있는 능력이다. ② 부적절 — 해킹 공격 방지는 보안 기능이지, 장애 발생 후 복구 능력인 장애 허용성과 다르다. ③ 적절 (정답) — 3문단에서 장애 허용성이 낮다는 것은 데이터의 불법적 변조나 기계적 에러가 발생할 경우 복구하기가 용이하지 않다는 것이고, 복제를 통해 장애 허용성을 확보한다고 하였다. 따라서 장애 허용성은 데이터에 이상이 발생해도 복구할 수 있는 대응 능력이다. ④ 부적절 — 결함이 있는 데이터를 그대로 받아들이는 것은 장애 허용성이 아니다. ⑤ 부적절 — 데이터를 직접 변환하는 능력은 장애 허용성과 다르다. 장애 허용성은 다른 기계의 복제본을 통해 복구하는 것이다. 4 ⓐ를 구현할 때 <보기>의 ⓑ나 ⓒ의 활용에 대해 설명한 내용으로 적절하지 않은 것은? < 보 기 > 복제를 구현하려면 원본 데이터 세트와 그것 전체를 복사한 복제본 데이터 세트를 하나 이상 마련하여 저장해야 한다. 복제는 원본과 복제본을 구분하여 취급할 것이냐, 아니냐에 따라 ⓑ마스터 슬레이브 방법과 ⓒ피어 투 피어 방법으로 나뉜다. 마스터 슬레이브 방법은 원본과 복제본을 구분하여 취급하는 복제이다. 원본 데이터 세트를 마스터라고 부르고 복제본 데이터 세트를 슬레이브라고 부른다. 읽기 요청은 마스터와 슬레이브에서 모두 분산하여 처리할 수 있지만 쓰기 요청은 마스터에서만 처리한다. 이렇게 마스터에서 수정된 데이터 세트는 슬레이브로 복제되어야 한다. 피어 투 피어 방법은 원본과 복제본을 구분하지 않고 모두 피어라고 부르며 대등하게 취급하는 복제이다. 읽기와 쓰기 요청을 모두 바쁘지 않은 피어에서 처리한다. 쓰기 요청에 의해 수정된 데이터 세트는 해당 피어에서 다른 피어로 복제되어야 한다. ① ⓑ를 채택할 때에는 복수의 기계에 동일한 내용의 마스터가 샤드로 존재하게 된다. ② ⓑ를 채택할 때에는 하나의 기계에 다른 내용의 마스터와 슬레이브가 샤드로 존재하게 된다. ③ ⓒ를 채택할 때에는 하나의 기계에 다른 내용의 샤드들이 피어로 존재하게 된다. ④ ⓒ를 채택할 때에는 복수의 기계에 동일한 내용의 샤드들이 피어로 존재하게 된다. ⑤ ⓑ나 ⓒ 중 어느 것을 채택하더라도 동일한 내용을 보관하는 샤드들 간에 일시적으로 일관성이 깨지는 순간이 존재한다. 출제 의도 — 구체적 사례 적용 샤딩과 복제의 결합(ⓐ)에 마스터 슬레이브(ⓑ) 또는 피어 투 피어(ⓒ) 방법을 적용하는 사례를 이해하는지 변별한다. 선지 분석 ① 부적절 (정답) — 샤딩에 따라 기계마다 다른 내용의 샤드가 저장되고, ⓑ에서 마스터는 원본 하나이므로 복수의 기계에 동일한 내용의 마스터가 샤드로 존재할 수 없다. 복수의 기계에 동일한 내용이 존재하는 것은 마스터와 슬레이브의 관계이다. ② 적절 — 3문단 예시처럼 기계 B에는 원본 샤드 s2(마스터)와 복제본 샤드 s1′(슬레이브)이 함께 저장되므로 하나의 기계에 내용이 다른 마스터와 슬레이브가 존재한다. ③ 적절 — 하나의 기계에는 내용이 다른 원본 샤드와 복제본 샤드가 함께 저장되며, ⓒ에서는 이를 모두 피어로 부른다. ④ 적절 — 복수의 기계에 동일한 내용의 샤드(원본과 복제본)가 저장되며, ⓒ에서는 이를 모두 피어로 대등하게 취급한다. ⑤ 적절 — 4문단에서 샤딩과 복제를 결합해도 기계 간 시간 지연으로 데이터 일관성이 일시적으로 깨지는 문제를 완전히 극복할 수 없다고 하였다. 함정 해부 [범위 변조] 마스터는 원본 하나이므로 복수의 기계에 동일한 내용의 마스터가 샤드로 존재할 수 없다. '복수의 기계 = 마스터 여럿'이라는 착각을 유도하는 함정이다. 5 ㉮의 문맥상 의미와 가장 가깝게 사용된 것은? ① 아이들이 장난으로 던진 돌에 항아리가 깨졌다. ② 태풍으로 배달이 늦어지는 바람에 계약이 깨졌다. ③ 그는 어둠 속에서 길을 가다가 넘어져 이마가 깨졌다. ④ 그 경기에서 세계 기록이 깨지는 일은 일어나지 않았다. ⑤ 국가 간에 사소한 문제로 평화가 깨지는 일은 없어야 한다. 출제 의도 — 단어의 의미 파악 다의어 '깨지다'의 문맥적 의미를 정확히 파악하는지 변별한다. 선지 분석 ① 부적절 — '항아리가 깨졌다'에서 '깨지다'는 '단단한 물건이 여러 조각이 나다'의 의미이다. ② 부적절 — '계약이 깨졌다'에서 '깨지다'는 '일 따위가 틀어져 성사가 안 되다'의 의미이다. ③ 부적절 — '이마가 깨졌다'에서 '깨지다'는 '얻어맞거나 부딪쳐 상처가 나다'의 의미이다. ④ 부적절 — '기록이 깨지는'에서 '깨지다'는 '어려운 관문이나 기록 따위가 돌파되다'의 의미이다. ⑤ 정답 — '평화가 깨지는'에서 '깨지다'는 '지속되던 분위기 따위가 일순간에 바뀌어 새로운 상태가 되다'의 의미로, ㉮의 '데이터 일관성이 깨지는'과 문맥상 유사한 의미이다. ★ 연계 포인트 수능 출제 핵심 포인트 Point 1. 라우터 vs 설정 서버 역할 구분 가장 빈번한 함정 유형. 라우터: 판별·조회·전달(클라이언트에). 설정 서버: 분할 정보·위치 정보·로그 정보 저장·관리. 라우터가 정보를 저장한다거나, 설정 서버가 클라이언트에 전달한다는 선지는 오답이다. Point 2. 성능 병목 현상 원인과 해결책의 정확한 이해 성능 병목은 데이터가 여러 샤드에 흩어져 있을 때 발생한다. 해결책은 데이터를 하나의 샤드에 모으는 데이터 지역성 확보이다. 원인과 해결책 모두 선지에서 반대로 뒤집어 제시하는 경우가 많다. Point 3. 복제에서 읽기 vs 쓰기의 차이 읽기: 복제본에서 분산 처리 가능. 쓰기: 원본 + 모든 복제본에 일관 적용 필요 → 속도 저하. 이 차이를 혼동하거나 읽기·쓰기 처리 방식을 반대로 서술한 선지에 주의. Point 4. 샤딩+복제 결합 한계 두 방법을 결합해도 기계 간 시간 지연 때문에 데이터 일관성이 일시적으로 깨지는 문제를 완전히 극복할 수 없다. "결합하면 모든 문제가 해결된다"는 선지는 오답이다. Point 5. <보기> 적용 문제: 마스터 슬레이브 vs 피어 투 피어 마스터 슬레이브: 원본(마스터) 하나 + 복제본(슬레이브). 쓰기는 마스터에서만. 피어 투 피어: 원본·복제본 구분 없이 모두 피어. 읽기·쓰기 모두 바쁘지 않은 피어에서 처리. 두 방법 모두 일시적 데이터 일관성 깨짐 발생. 핵심 TIP: 저장소 분산 vs 부하 분산 구분 저장소 분산 = 저장 공간의 분산(비용 절감). 부하 분산 = 연산 처리의 분산(속도 향상). 두 개념은 독립적이며, 둘 다 샤딩을 통해 얻을 수 있다. 혼동하지 말 것. 함정 패턴 특강 ⚠ 함정 패턴 1: 인과 역전 성능 병목 현상의 원인(데이터 분산) vs 해결책(데이터 집중·지역성)을 뒤집는 패턴. 또는 분산 파일 관리 체계가 비용을 증가시킨다고 서술하는 패턴. ⚠ 함정 패턴 2: 역할 뒤바꿈 라우터의 역할(판별·조회·전달)과 설정 서버의 역할(정보 저장·관리)을 뒤바꾸는 패턴. 또는 데이터를 서버에 전달한다고 서술하는 패턴(클라이언트에 전달이 맞음). ⚠ 함정 패턴 3: 범위 변조 "반드시", "항상", "완전히" 등의 표현으로 과잉 일반화. 샤딩+복제 결합으로 데이터 일관성 문제가 완전히 해결된다거나, 분산 파일 관리 체계가 반드시 고성능 기계가 필요하다는 진술. 샤딩 시스템 구성 요소 요약 카드 구성 요소 역할 저장 정보 클라이언트 서버에 데이터 요청 / 결과 수신 — 라우터 어떤 샤드에 데이터가 있는지 판별 → 데이터 조회 → 클라이언트에 전달 — 설정 서버 라우터의 역할 수행을 지원하기 위해 정보 저장·관리 분할 정보 / 위치 정보 / 로그 정보 샤드(각 기계) 분할된 데이터(샤드) 저장 / 쓰기·읽기·연산 처리 서로 다른 내용의 데이터 핵심 구분: 샤딩의 두 가지 약점 ① 성능 병목 현상 → 데이터 지역성 확보로 해결. ② 낮은 장애 허용성 → 복제와 결합으로 해결. 두 약점과 해결책을 정확히 대응시킬 것. 복제 결합 후에도 데이터 일관성 일시 붕괴 문제는 완전 해결 불가.

학습 OX 문항 (20문항)

Q1. 기본 분산 파일 관리 체계는 데이터의 불법 변조를 방지하고 기계적 결함에 대응하여 데이터 유실로부터 안전을 도모하는 데 유리하다.
정답: O — 정답(O)! 1문단에서 분산 파일 관리 체계는 데이터의 불법 변조를 방지하고, 기계적 결함에 대응하여 데이터의 유실로부터 안전을 도모하는 데 유리한 전략이라고 하였다.
반대 선택 시: 오답. 1문단에 따르면 분산 파일 관리 체계는 데이터의 불법 변조 방지와 유실 방지에 유리하다.
Q2. 기본 샤딩에서 라우터는 어떤 샤드에 해당 데이터가 저장되어 있는지를 판별하고 그 샤드에서 필요한 데이터를 조회해서 클라이언트에 전달한다.
정답: O — 정답(O)! 2문단에서 라우터는 어떤 샤드에 해당 데이터가 저장되어 있는지를 판별하고, 그 샤드에서 필요한 데이터를 조회해서 클라이언트에 전달한다고 하였다.
반대 선택 시: 오답. 2문단에 따르면 라우터는 샤드에서 데이터를 조회해 클라이언트에 전달한다.
Q3. 기본 설정 서버에는 전체 샤드의 분할 정보와 위치 정보가 저장·관리된다.
정답: O — 정답(O)! 2문단에서 설정 서버는 전체 샤드의 분할 정보와 위치 정보를 저장하고 관리한다고 하였다.
반대 선택 시: 오답. 2문단에 따르면 설정 서버에는 분할 정보와 위치 정보가 저장·관리된다.
Q4. 기본 샤딩의 부하 분산은 데이터의 쓰기, 읽기 및 연산을 각 샤드마다 다른 기계가 분산하여 처리하게 하는 것이다.
정답: O — 정답(O)! 2문단에서 부하 분산은 샤딩을 통해 데이터의 쓰기, 읽기 및 연산을 각 샤드마다 다른 기계가 분산하여 처리하게 하는 것이라고 하였다.
반대 선택 시: 오답. 2문단에 따르면 부하 분산은 각 샤드마다 다른 기계가 쓰기·읽기·연산을 분산 처리하게 하는 것이다.
Q5. 기본 복제는 샤딩과 달리 각기 다른 기계에 같은 내용의 데이터를 저장하는 분산 방법이다.
정답: O — 정답(O)! 3문단에서 복제는 샤딩과 달리 각기 다른 기계에 같은 내용의 데이터를 저장하는 분산 방법이라고 하였다.
반대 선택 시: 오답. 3문단에 따르면 복제는 각기 다른 기계에 같은 내용의 데이터를 저장하는 방법이다.
Q6. 기본 분산 파일 관리 체계에서는 다수의 저렴한 저성능 기계를 연결하여 비용을 절감하면서도 높은 수준의 성능을 확보할 수 있다.
정답: O — 정답(O)! 1문단에서 분산 파일 관리 체계에서는 다수의 저렴한 저성능 기계를 연결하여 데이터를 관리함으로써 비용을 절감하면서도 높은 수준의 성능을 확보할 수 있다고 하였다.
반대 선택 시: 오답. 1문단에 따르면 분산 파일 관리 체계는 저렴한 저성능 기계 다수를 연결해 비용 절감과 고성능을 동시에 달성한다.
Q7. 기본 샤딩의 약점 중 하나는 장애 허용성이 낮다는 것으로, 이는 샤드마다 다른 데이터가 들어 있기 때문이다.
정답: O — 정답(O)! 3문단에서 샤딩이 갖는 약점은 샤드마다 다른 데이터가 들어 있기 때문에 데이터의 불법적 변조나 기계적 에러가 발생할 경우 복구하기가 용이하지 않아 장애 허용성이 낮다고 하였다.
반대 선택 시: 오답. 3문단에 따르면 샤딩은 샤드마다 다른 데이터가 저장되어 있어 장애 허용성이 낮다.
Q8. 심화 데이터 지역성을 확보하는 것은 샤딩에서 성능 병목 현상을 줄이는 핵심적인 방법이다.
정답: O — 정답(O)! 3문단에서 하나의 요청에 의해 액세스되는 데이터들은 가능하면 하나의 샤드에 배분되도록 설계하여 데이터의 지역성을 확보하는 것이 샤딩 성능을 높이는 핵심적인 방법이라고 하였다.
반대 선택 시: 오답. 3문단에 따르면 데이터 지역성 확보가 성능 병목 현상을 줄이는 핵심 방법이다.
Q9. 심화 복제에서 클라이언트의 읽기 요청은 복제본에서 분산하여 처리할 수 있다.
정답: O — 정답(O)! 3문단에서 복제에서는 클라이언트의 읽기 요청을 서버가 복제본에서 분산하여 처리할 수 있다고 하였다.
반대 선택 시: 오답. 3문단에 따르면 복제에서 읽기 요청은 복제본에서 분산 처리가 가능하다.
Q10. 심화 샤딩과 복제를 결합하면 어떤 샤드에서 에러가 발생했을 때 그 샤드의 복제본으로부터 정상적인 데이터를 받아 에러를 수정할 수 있다.
정답: O — 정답(O)! 3문단에서 샤딩에 복제를 결합하면 어떤 샤드에서 에러가 발생했을 때 에러가 발생하지 않은 그 샤드의 복제본으로부터 정상적인 데이터를 넘겨받아 에러를 수정할 수 있다고 하였다.
반대 선택 시: 오답. 3문단에 따르면 샤딩+복제 결합 시 에러 발생 샤드의 복제본으로부터 데이터를 복구할 수 있다.
Q11. 심화 저장소 분산은 저장 용량이 작은 저가의 기계를 여러 개 합쳐서 고가의 기계 한 대와 동일한 저장 용량을 확보하여 비용을 절감하는 방법이다.
정답: O — 정답(O)! 2문단에서 저장소 분산은 샤딩을 통해 저장 용량이 큰 고가의 기계 대신에 저장 용량이 작은 저가의 기계를 여러 개 합쳐서 동일 저장 용량을 확보하는 것이며, 비용 절감 효과가 있다고 하였다.
반대 선택 시: 오답. 2문단에 따르면 저장소 분산은 저가의 소용량 기계 여러 개로 동일 저장 용량을 확보하는 것이다.
Q12. 심화 설정 서버에는 분할 정보와 위치 정보뿐 아니라 각 샤드의 이용 내역을 보여 주는 로그 정보도 저장될 수 있다.
정답: O — 정답(O)! 2문단에서 설정 서버에는 분할 정보와 위치 정보뿐 아니라 각각의 샤드가 어떻게 이용되었는지를 보여 주는 로그 정보도 저장되기도 한다고 하였다.
반대 선택 시: 오답. 2문단에 따르면 설정 서버에는 분할 정보, 위치 정보, 로그 정보가 저장된다.
Q13. 심화 샤딩에 복제를 결합할 때, 기계 B에 원본 샤드 s2와 복제본 샤드 s1′이 함께 저장되는 것은 한 기계에 내용이 다른 샤드들이 존재하는 사례이다.
정답: O — 정답(O)! 3문단에서 기계 B에는 원본 샤드 s2와 복제본 샤드 s1′이 함께 저장된다고 하였다. s2와 s1′은 내용이 다른 샤드들이다.
반대 선택 시: 오답. 3문단 예시에서 기계 B에는 내용이 다른 원본 샤드 s2와 복제본 샤드 s1′이 함께 저장된다.
Q14. 심화 복제에서 쓰기 작업은 원본이나 복제본에서 단독으로 이루어지지 않고 원본과 모든 복제본에 일관되게 적용되어야 하므로 연산 속도가 느려질 수 있다.
정답: O — 정답(O)! 3문단에서 쓰기 작업은 원본이나 복제본에서 단독으로 이루어지면 안 되고 원본과 모든 복제본에 일관되게 적용되어야 하기 때문에 연산 속도가 느려지는 문제가 발생할 수 있다고 하였다.
반대 선택 시: 오답. 3문단에 따르면 쓰기 작업은 원본과 모든 복제본에 일관 적용되어야 하므로 속도가 느려질 수 있다.
Q15. 고난도 라우터는 전체 샤드의 분할 정보와 위치 정보를 저장하고 관리하여 설정 서버가 데이터를 클라이언트에 전달할 수 있도록 지원한다.
정답: X — 정답(X)! 라우터와 설정 서버의 역할이 완전히 뒤바뀐 진술이다. 분할 정보와 위치 정보를 저장·관리하는 것은 설정 서버이고, 데이터를 판별·조회하여 클라이언트에 전달하는 것은 라우터이다. 설정 서버가 클라이언트에 직접 전달하는 것도 아니다.
반대 선택 시: 오답. 분할 정보와 위치 정보를 저장·관리하는 것은 설정 서버이고, 클라이언트에 데이터를 전달하는 것은 라우터이다. 두 역할이 뒤바뀌어 있다.
Q16. 고난도 성능 병목 현상은 데이터가 하나의 샤드에 집중되어 처리 용량을 초과할 때 발생하며, 이를 해결하기 위해 데이터를 여러 샤드에 분산 배치해야 한다.
정답: X — 정답(X)! 성능 병목 현상의 원인이 뒤집혀 서술된 거짓 진술이다. 성능 병목 현상은 데이터가 하나의 샤드에 집중될 때가 아니라 여러 샤드에 흩어져 있을 때 발생한다. 해결책도 데이터를 분산 배치하는 것이 아니라 하나의 샤드에 모으는 데이터 지역성 확보이다.
반대 선택 시: 오답. 성능 병목 현상은 데이터가 여러 샤드에 흩어져 있을 때 발생한다. 해결책은 데이터를 하나의 샤드에 모으는 데이터 지역성 확보이다.
Q17. 고난도 복제에서 쓰기 작업은 원본 또는 복제본 중 어느 하나에서만 처리하고, 이후 다른 기계들이 동기화하는 방식으로 진행되어 빠른 쓰기 속도를 보장한다.
정답: X — 정답(X)! 복제에서 쓰기 작업은 원본이나 복제본에서 단독으로 이루어지면 안 되고 원본과 모든 복제본에 일관되게 적용되어야 한다고 하였다. 하나에서만 처리하고 이후 동기화하는 방식이 아니며, 오히려 이 때문에 연산 속도가 느려지는 문제가 발생한다.
반대 선택 시: 오답. 쓰기 작업은 원본과 모든 복제본에 일관 적용되어야 하므로 속도가 느려질 수 있다. 빠른 쓰기 속도를 보장한다는 진술은 지문과 반대이다.
Q18. 고난도 샤딩에 복제를 결합하면 데이터 일관성이 일시적으로 깨지는 문제를 완전히 극복할 수 있어 추가적인 기술 발전이 필요하지 않다.
정답: X — 정답(X)! 4문단에서 샤딩에 복제를 결합한다고 해도 기계와 기계의 연결 과정에서 발생하는 시간 지연 때문에 데이터 일관성이 일시적으로 깨지는 문제를 완전히 극복할 수는 없다고 명시하였다. 따라서 추가적인 기술 발전이 필요하다고 하였다.
반대 선택 시: 오답. 4문단에 따르면 샤딩+복제 결합으로도 데이터 일관성 문제를 완전히 극복할 수 없으며, 기술상의 발전이 여전히 필요하다.
Q19. 고난도 분산 파일 관리 체계에서는 반드시 고성능 기계를 사용해야 하므로 단일 기계 서버보다 비용이 항상 더 많이 든다.
정답: X — 정답(X)! 1문단에서 분산 파일 관리 체계는 다수의 저렴한 저성능 기계를 연결하여 비용을 절감한다고 하였다. 고성능 기계가 반드시 필요한 것이 아니라 오히려 저성능 기계를 연결하는 것이 핵심이다. 비용도 단일 기계 서버보다 절감된다.
반대 선택 시: 오답. 분산 파일 관리 체계는 저렴한 저성능 기계를 연결하여 비용을 절감하는 것이 핵심 장점이다. 고성능 기계가 반드시 필요하다는 진술은 지문과 반대이다.
Q20. 고난도 샤딩의 저장소 분산을 통해 비용을 절감하려면 반드시 저장 용량이 큰 고가의 기계를 다수 확보해야 하며, 저가의 기계만으로는 동일 저장 용량을 확보할 수 없다.
정답: X — 정답(X)! 2문단에서 저장소 분산은 저장 용량이 큰 고가의 기계 대신에 저장 용량이 작은 저가의 기계를 여러 개 합쳐서 동일 저장 용량을 확보하는 것이라고 하였다. 저가의 기계로도 동일 저장 용량을 충분히 확보할 수 있다.
반대 선택 시: 오답. 저장소 분산은 고가의 기계 대신 저가의 기계 여러 개로 동일 저장 용량을 확보하는 것이다. 반드시 고가의 기계가 필요하다는 진술은 지문과 반대이다.