Эта страница поможет самостоятельно оценить навыки и кругозор в DE, а также ответит на часто задаваемые вопросы. Роадмап с упорядочиванием и полной детализацией тем и инструментов в проработке.

Наиболее часто встречаемые инструменты и термины на апрель 2024

🌏 СНГ (Россия, Украина, Казахстан и др.)

Airflow, Hadoop (HDFS), Spark, Greenplum/PostgreSQL, ClickHouse, Python, SQL, Git

🌐 Америка, Европа, Англия

AWS (Glue, Redshift, S3), Snowflake/Databricks, Spark, Kafka, HDFS, Airflow, Python, SQL, Docker, Git

Менее часто: Terraform, Hive, dbt, GCP (BigQuery, Cloud Compose)/Azure (Synapse, Data Factory)

Более подробно и data-driven распределение навыков в вакансиях по странам смотри здесь: 🛠️ Skills (datanerd.tech)

Ниже моими словами будут описаны термины и понятия, которые я считаю важными для прохождения собеседований и работы по профессии дата инженера. Попробуй ответить самостоятельно, потом сверься с подсказкой. Страница будет постепенно обновляться - следи за дополнениями. Также о терминах и понятиях пишу тут: https://t.me/rzv_de

📕 Термины, которые стоит изучить для собеседований (кроме SQL и Python)

Про данные и профессию в целом

Роль дата инженера