Databricks Certified Data Engineer Professional Exam (Databricks-Certified-Data-Engineer-Professional日本語版) - Databricks-Certified-Data-Engineer-Professional日本語무료 덤프문제 풀어보기

データエンジニアがDatabricksクエリプロファイラーでクエリの実行を確認している際、「上位演算子」パネルに、処理時間(Time Spent)とメモリピーク(Memory Peak)のメトリックが高いソート演算子が表示されていることを発見しました。Spark UIにも、頻繁なデータ流出が報告されています。データエンジニアはこの問題にどのように対処すべきでしょうか?

정답: C
설명: (Fast2test 회원만 볼 수 있음)
Lakehouse内のcustomer_churn_paramsというテーブルは、機械学習チームによる顧客離脱予測に使用されています。このテーブルには、複数の上流ソースから得られた顧客情報が含まれています。現在、データエンジニアリングチームは、上流データソースから得られた最新の有効な値でこのテーブルを毎晩上書きすることで、データを更新しています。
MLチームが使用しているチャーン予測モデルは、本番環境では比較的安定しています。チームは過去24時間以内に変更されたレコードのみに基づいて予測を行うことに注力しています。
変更されたレコードの識別を簡素化するアプローチはどれでしょうか?

정답: B
설명: (Fast2test 회원만 볼 수 있음)
Databricks Asset Bundle プロジェクトのファイル resources/app.yml で、データ エンジニアは Databricks アプリ databricks_app_deployed とボリューム volume_deployed をデプロイし、Databricks アプリの背後にあるサービス プリンシパルにボリュームへの読み取りおよび書き込みのアクセス許可を付与したいと考えています。
データ エンジニアはどのようにしてデプロイメントを実現する必要がありますか?

정답: C
설명: (Fast2test 회원만 볼 수 있음)
Spark Structured Streaming で使用される一般的なプログラミング モデルの特徴を説明する記述はどれですか。

정답: B
설명: (Fast2test 회원만 볼 수 있음)
データエンジニアは、Databricks 間のシナリオにおいて読み取りパフォーマンスを最適化するために、Delta Sharing を設定しようとしています。受信者は、共有された売上データに対してタイムトラベルクエリとストリーミング読み取りを実行する必要があります。これらの機能を有効にしながら最適なパフォーマンスを実現するには、どの構成が最適でしょうか?

정답: A
설명: (Fast2test 회원만 볼 수 있음)
データエンジニアリングチームのメンバーが、より大規模なデータパイプラインの一部としてスケジュール設定したいという短いノートブックを提出しました。以下のコマンドは、提示されているとおりに実行した場合に論理的に正しい結果を生成するものと仮定します。

ジョブとしてスケジュールする前にノートブックから削除する必要があるコマンドはどれですか?

정답: A
설명: (Fast2test 회원만 볼 수 있음)
データ アーキテクトは、データが外部ソースから Databricks Lakehouse に取り込まれたら、テーブル アクセス制御を活用してすべての運用テーブルとビューのアクセス許可を管理することを決定しました。
次のロジックを実行して、運用データベースでの対話型クエリの権限をコア エンジニアリング グループに付与しました。
データベース prod の使用権限を eng に付与します。
データベース prod に対する SELECT 権限を eng に付与します。
これらが eng グループに付与されている唯一の権限であり、これらのユーザーはワークスペース管理者ではないと仮定すると、どのステートメントがそれらの権限について説明していますか?

정답: A
설명: (Fast2test 회원만 볼 수 있음)
ある企業は、アカウントの取引をDelta Lakeテーブルに保存しています。アカウントレベルの相関関係(例:UPDATEステートメント)を頻繁に適用する必要がありますが、ファイルのチャーン(変化)を減らし、書き込みパフォーマンスを向上させるため、変更のたびにParquetファイル全体を書き換えるのを避けたいと考えています。Delta Lakeのどの機能を有効にすべきでしょうか?

정답: A
설명: (Fast2test 회원만 볼 수 있음)
データエンジニアは、修復履歴を含む最新のジョブ実行に関する情報を収集するアプリケーションを作成する必要があります。データエンジニアはリクエストをどのようにフォーマットすればよいでしょうか?

정답: C
설명: (Fast2test 회원만 볼 수 있음)
データエンジニアは、Unity Catalog で管理されるテーブル内の機密性の高い列に列マスキングを実装する必要があります。マスキングロジックでは、ユーザーが特定のグループに属しているかどうかを動的にチェックする必要があります。このグループは、グループを許可された部門にマッピングする別のテーブル(group_access)で定義されています。この要件を効率的に適用するには、エンジニアはどのようなアプローチを採用すべきでしょうか?

정답: B
설명: (Fast2test 회원만 볼 수 있음)
上流システムは、特定のデータバッチの日付をパラメータとしてDatabricks Jobs APIに渡すように構成されています。スケジュール対象のノートブックは、このパラメータを使用して、以下のコードでデータを読み込みます。
df = spark.read.format("parquet").load(f"/mnt/source/(date)")
上記のコード ブロックで使用されている日付 Python 変数を作成するには、どのコード ブロックを使用する必要がありますか?

정답: C
설명: (Fast2test 회원만 볼 수 있음)
データエンジニアリングチームは、毎晩のバッチ更新を通じて集計統計テーブルを維持しています。このテーブルには、前日の合計売上に加え、過去7日間、年初来、四半期初来など、様々な期間の合計と平均が含まれています。このテーブルはstore_saies_summaryという名前で、スキーマは以下のとおりです。

daily_store_sales テーブルには、store_sales_summary を更新するために必要なすべての情報が含まれています。
このテーブルのスキーマは次のとおりです。
店舗ID INT、売上日 DATE、売上合計 FLOAT
daily_store_sales がタイプ 1 テーブルとして実装され、手動データ監査後に total_sales 列が調整される可能性がある場合、store_sales_summary テーブルで正確なレポートを生成するための最も安全な方法はどれですか。

정답: C
テーブルは次のコードで登録されます。

users と orders はどちらも Delta Lake テーブルです。recent_orders をクエリした結果を説明するステートメントはどれですか。

정답: A
설명: (Fast2test 회원만 볼 수 있음)

우리와 연락하기

문의할 점이 있으시면 메일을 보내오세요. 12시간이내에 답장드리도록 하고 있습니다.

근무시간: ( UTC+9 ) 9:00-24:00
월요일~토요일

서포트: 바로 연락하기 

English Deutsch 繁体中文 日本語