[2026] Microsoft Data Engineering on Microsoft Azure (DP-203 Korean Version)

문제1

Azure 데이터 팩터리가 있습니다.
Activity1이라는 활동이 포함된 파이프라인을 실행합니다. Activity1은 다음 출력을 생성합니다.

다음 각 진술에 대해 진술이 참이면 예를 선택하십시오. 그렇지 않으면 아니요를 선택합니다.
참고: 각 올바른 선택은 1점의 가치가 있습니다.

정답:

Explanation:

문제2

Azure Databricks 대화형 클러스터를 디자인하고 있습니다. 클러스터는 드물게 사용되며 자동 종료되도록 구성됩니다.
클러스터가 종료된 후 클러스터 구성이 무기한 유지되는지 확인해야 합니다. 솔루션은 비용을 최소화해야 합니다.
어떻게 해야 합니까?

A. 처리가 완료되면 클러스터를 수동으로 종료합니다.

B. 클러스터를 고정합니다.

C. 클러스터가 종료된 후 복제합니다.

D. 90일마다 클러스터를 시작하는 Azure Runbook을 만듭니다.

정답: B

설명: (Fast2test 회원만 볼 수 있음)

문제3

다음 팩트 테이블을 포함하는 온프레미스 데이터 웨어하우스가 있습니다. 두 테이블 모두 DateKey, ProductKey, RegionKey 열이 있습니다. 120개의 고유한 제품 키와 65개의 고유한 지역 키가 있습니다.

데이터 웨어하우스를 사용하는 쿼리는 완료하는 데 시간이 오래 걸립니다.
Azure Synapse Analytics를 사용하도록 솔루션을 마이그레이션할 계획입니다. Azure 기반 솔루션이 쿼리 성능을 최적화하고 처리 왜곡을 최소화하는지 확인해야 합니다.
무엇을 추천해야 할까요? 대답하려면 대답 영역에서 적절한 옵션을 선택하십시오.
참고: 각 올바른 선택은 1점의 가치가 있습니다.

정답:

Explanation:

Box 1: Hash-distributed
Box 2: ProductKey
ProductKey is used extensively in joins.
Hash-distributed tables improve query performance on large fact tables.
Box 3: Round-robin
Box 4: RegionKey
Round-robin tables are useful for improving loading speed.
Consider using the round-robin distribution for your table in the following scenarios:
When getting started as a simple starting point since it is the default If there is no obvious joining key If there is not good candidate column for hash distributing the table If the table does not share a common join key with other tables If the join is less significant than other joins in the query When the table is a temporary staging table Note: A distributed table appears as a single table, but the rows are actually stored across 60 distributions. The rows are distributed with a hash or round-robin algorithm.
Reference:
https://docs.microsoft.com/en-us/azure/sql-data-warehouse/sql-data-warehouse-tables-distribute

문제4

Azure Data Lake Storage Gen2의 배포를 계획하고 있습니다.
데이터 레이크에 액세스할 다음 두 보고서가 있습니다.
Report1: 50개의 열이 포함된 파일에서 3개의 열을 읽습니다.
Report2: 타임스탬프를 기반으로 단일 레코드를 쿼리합니다.
보고서를 지원하려면 데이터 레이크에 데이터를 저장할 형식을 권장해야 합니다. 솔루션은 읽기 시간을 최소화해야 합니다.
각 보고서에 대해 무엇을 권장해야 합니까? 대답하려면 대답 영역에서 적절한 옵션을 선택하십시오.
참고: 각 올바른 선택은 1점의 가치가 있습니다.

정답:

Explanation:

Report1: CSV
CSV: The destination writes records as delimited data.
Report2: AVRO
AVRO supports timestamps.
Not Parquet, TSV: Not options for Azure Data Lake Storage Gen2.
Reference:
https://streamsets.com/documentation/datacollector/latest/help/datacollector/UserGuide/Destinations/ADLS- G2-D.html

문제5

Azure Data Lake Storage Gen2를 사용합니다.
디스크에서 데이터를 읽을 때 워크로드가 필터 조건자 및 열 프로젝션을 사용하여 데이터를 필터링할 수 있는지 확인해야 합니다.
어떤 두 가지 작업을 수행해야 합니까? 각 정답은 솔루션의 일부를 나타냅니다.
참고: 각 올바른 선택은 1점의 가치가 있습니다.

A. 컨테이너로 범위가 지정된 스토리지 정책을 만듭니다.

B. Azure Storage 리소스 공급자를 다시 등록합니다.

C. 쿼리 가속 기능을 등록합니다.

D. 컨테이너 접두사 필터로 범위가 지정된 스토리지 정책을 만듭니다.

E. Microsoft Data Lake Store 리소스 공급자를 다시 등록합니다.

정답: B,C

문제6

Azure Data Factory에는 태평양 표준시로 예약된 일정 트리거가 있습니다.
태평양 표준시는 일광 절약 시간을 준수합니다.
트리거에는 다음 JSON 파일이 있습니다.

드롭다운 메뉴를 사용하여 제공된 정보를 기반으로 각 문항을 완성하는 답변 선택을 선택하세요.
참고: 올바른 선택은 각각 1점의 가치가 있습니다.

정답:

Explanation:

문제7

16개의 파티션이 있는 retailhub라는 Azure 이벤트 허브가 있습니다. 트랜잭션은 retailhub에 게시됩니다. 각 거래에는 거래 ID, 개별 항목 및 결제 세부정보가 포함됩니다. 트랜잭션 ID는 파티션 키로 사용됩니다.
소매점에서 잠재적 사기 거래를 식별하기 위해 Azure Stream Analytics 작업을 설계하고 있습니다. 작업은 retailhub를 입력으로 사용합니다. 이 작업은 트랜잭션 ID, 개별 라인 항목, 결제 세부 정보, 사기 점수 및 사기 지표를 출력합니다.
사기 허브라는 Azure 이벤트 허브로 출력을 보낼 계획입니다.
사기 탐지 솔루션의 확장성이 뛰어나고 트랜잭션을 가능한 한 빨리 처리하는지 확인해야 합니다.
Stream Analytics 작업의 출력을 어떻게 구성해야 합니까? 대답하려면 대답 영역에서 적절한 옵션을 선택하십시오.
참고: 각 올바른 선택은 1점의 가치가 있습니다.

정답:

Explanation:

Box 1: 16
For Event Hubs you need to set the partition key explicitly.
An embarrassingly parallel job is the most scalable scenario in Azure Stream Analytics. It connects one partition of the input to one instance of the query to one partition of the output.
Box 2: Transaction ID
Reference:
https://docs.microsoft.com/en-us/azure/event-hubs/event-hubs-features#partitions

문제8

Azure Synapse Analytics 전용 SQL 풀을 디자인하고 있습니다.
개인 식별 정보(PII)에 대한 액세스를 감사할 수 있는지 확인해야 합니다.
솔루션에 무엇을 포함해야 합니까?

A. 열 수준 보안

B. 민감도 분류

C. 동적 데이터 마스킹

D. 행 수준 보안(RLS)

정답: B

설명: (Fast2test 회원만 볼 수 있음)

문제9

매시간 트리거되는 Azure Data Factory 파이프라인이 있습니다.
파이프라인은 지난 7일 동안 100% 성공했습니다.
파이프라인 실행이 실패하고 15분 간격으로 발생하는 두 번의 재시도도 실패합니다. 세 번째 실패는 다음 오류를 반환합니다.

오류의 가능한 원인은 무엇입니까?

A. 2021년 1월 10일 06:00부터 07:00까지 wwi/BIKES/CARBON의 데이터 파일 형식이 잘못되었습니다.

B. 2021년 1월 10일 06:00부터 07:00까지 wwi/BIKES/CARBON에 데이터가 없었습니다.

C. year=2021/month=01/day=10/hour=06을 생성하는 데 사용된 매개변수가 잘못되었습니다.

D. 파이프라인이 너무 일찍 트리거되었습니다.

정답: C

문제10

CSV 파일에서 데이터를 수집하고 지정된 데이터 유형으로 열을 캐스팅하고 Azure Synapse Analytic 전용 SQL 풀의 테이블에 데이터를 삽입하는 Azure Data Factory 데이터 흐름을 만들고 있습니다. CSV 파일에는 사용자 이름, 설명 및 날짜라는 세 개의 열이 있습니다.
데이터 흐름에는 이미 다음이 포함되어 있습니다.
소스 변환.
적절한 데이터 유형을 설정하기 위한 파생 열 변환.
데이터를 풀에 배치하기 위한 싱크 변환.
데이터 흐름이 다음 요구 사항을 충족하는지 확인해야 합니다.
모든 유효한 행은 대상 테이블에 기록되어야 합니다.
주석 열의 잘림 오류는 사전 예방적으로 방지해야 합니다.
삽입 시 잘림 오류가 발생하는 주석 값을 포함하는 모든 행은 Blob Storage의 파일에 기록되어야 합니다.
어떤 두 가지 작업을 수행해야 합니까? 각 정답은 솔루션의 일부를 나타냅니다.
참고: 각 올바른 선택은 1점의 가치가 있습니다.

A. 데이터 흐름에 필터 변환을 추가하여 잘림 오류를 일으키는 행을 필터링합니다.

B. 데이터 흐름에 싱크 변환을 추가하여 Blob Storage의 파일에 행을 씁니다.

C. 잘림 오류를 발생시키는 행만 선택하도록 선택 변환을 추가합니다.

D. 데이터 흐름에 조건부 분할 변환을 추가하여 잘림 오류를 일으킬 행을 분리합니다.

정답: B,D

설명: (Fast2test 회원만 볼 수 있음)

문제11

다음 표에 표시된 리소스가 포함된 Azure 구독이 있습니다.

ws1에서 Spark 노트북을 사용할 수 있는지 확인해야 합니다. 솔루션은 UAMI1을 사용하여 kv1의 비밀을 보장해야 합니다. 어떻게 해야 합니까? 대답하려면 대답 영역에서 적절한 옵션을 선택하십시오.
참고: 각 올바른 선택은 1점의 가치가 있습니다.

정답:

Explanation:

문제12

Azure Databrick 클러스터에 대한 애플리케이션 메트릭, 스트리밍 쿼리 이벤트 및 애플리케이션 로그 메시지를 수집해야 합니다.
어떤 유형의 라이브러리 및 작업 영역을 구현해야 합니까? 대답하려면 대답 영역에서 적절한 옵션을 선택하십시오.
참고: 각 올바른 선택은 1점의 가치가 있습니다.

정답:

Explanation:

You can send application logs and metrics from Azure Databricks to a Log Analytics workspace. It uses the Azure Databricks Monitoring Library, which is available on GitHub.
References:
https://docs.microsoft.com/en-us/azure/architecture/databricks-monitoring/application-logs

문제13

SQLDB1이라는 Azure SQL 데이터베이스와 Pool1이라는 Azure Synapse Analytics 전용 SQL 풀이 포함된 Azure 구독이 있습니다.
SQLDB1에서 Pool1로 데이터를 복제해야 합니다. 솔루션은 다음 요구 사항을 충족해야 합니다.
* SQLDB1의 성능 영향을 최소화합니다.
* 거의 실시간(NRT) 분석을 지원합니다.
* 행정적 노력을 최소화합니다.
무엇을 사용해야 하나요?

A. Azure 개인 링크

B. Azure Synapse 링크

C. Azure용 SQL 데이터 동기화

D. Microsoft SQL Server의 트랜잭션 복제

정답: B

Microsoft Data Engineering on Microsoft Azure (DP-203 Korean Version) - DP-203 Korean무료 덤프문제 풀어보기

우리와 연락하기

유용한 링크

최신 업데이트