صاحب العمل نشط
عضو فريق هندسة البيانات
نحن نبحث عن عضو في فريق هندسة البيانات يتمتع بخبرة لا تقل عن سنتين، لتقديم خطوط أنابيب لتنظيف البيانات وتحويلها بشكل شامل. بالإضافة إلى العمل كصحفي بيانات يمكنه فهم مصادر البيانات، وجمع البيانات من مصادر موثوقة، والتعبير عن مشاكل العمل، وتشكيل مجموعات البيانات في تنسيقات تمثيلية، يمكنه أيضًا العمل كأخصائي تكامل/إثراء البيانات الذي يمكنه استكشاف البيانات من مصادر خارجية وداخلية ثم تقوم المصادر بدمجها مع مجموعة بيانات الحقيقة الأساسية لدينا، علاوة على ذلك ستكون مسؤولة عن الجزء الهندسي للميزات، لذا يجب تحويل مجموعة البيانات النهائية وإعدادها لاستهلاكها من قبل فريق علم البيانات.
ستشمل المهام الرئيسية على سبيل المثال لا الحصر:
تنظيف البيانات، والمعالجة المسبقة، وهندسة الميزات، وتحليل البيانات الاستكشافية.
تحويل البيانات غير المنظمة إلى تنسيقات بيانات أكثر ملاءمة.
قم ببناء خطوط أنابيب ETL (الاستخراج والتحويل والتحميل) المطلوبة باستخدام أدوات ETL أو أدوات ETL المستندة إلى Python.
اعمل مع علماء البيانات لفهم أفضل لاحتياجات العمل وإجراء التحليل المطلوب.
بناء حلول تحليلية آلية (استيعاب البيانات وتحويلها وتخزينها وتكامل التحليلات).
قم بتطوير واجهات برمجة التطبيقات لتوفير الوصول المحمي إلى البيانات والقدرة على التكامل مع الأنظمة الأساسية الأخرى.
مساعدة فرق علوم البيانات في نشر نماذج التعلم الآلي ودمجها في أنظمة الإنتاج.
تطبيق تقنيات التعلم الآلي الأساسية مثل الانحدار والتصنيف والتجميع لحل التحديات المتعلقة بالبيانات.
قم بتطبيق تقنيات المعالجة المسبقة مثل الترميز والقطع وإزالة كلمات التوقف لإعداد البيانات النصية لمهام البرمجة اللغوية العصبية.
دوام كامل