49 %

آموزش استفاده از پایگاه داده هدوپ (Hadoop) آنلاین

هدوپ (Apache Hadoop) مجموعه‌ای از نرم‌افزارهای منبع باز است که استفاده از شبکه‌ای از رایانه‌های زیادی را برای حل مشکلات مربوط به حجم عظیم داده و محاسبات تسهیل می‌کند.

توضیحات

فارسی
8 ساعت
غیر حضوری
5 فصل
از طریق واتس اپ یا ارسال تیکت
مقدماتی
دارای گواهینامه
چه امتیازی میدی؟

 

آموزش استفاده از پایگاه داده هدوپ (Hadoop) آنلاین

آموزش استفاده از پایگاه داده هدوپ (Hadoop) آنلاین دوره ای پروژه محور و مقدماتی تا پیشرفته است که توسط هلدینگ فرتاک ارائه شده است.

هدوپ یک نرم افزار متن باز است که برای ذخیره سازی و پردازش داده های بزرگ به کار می رود.هدوپ اولین بار در شرکت آپاچی ارائه و به وسیله زبان برنامه نویسی جاوا نوشته شده است که شما در آموزش استفاده از پایگاه داده هدوپ (Hadoop) آنلاین با آن آشنا میشوید.

 

پیش‌ نیاز این دوره

 

آشنایی ذخیره و بازیابی اطلاعات

آشنایی پایگاه داده‌ها

آشنایی با سیستم‌های توزیع شده

کاربرد هدوپ (hadoop) چیست؟

درواقع هدوپ برای ذخیره کردن و فراخوانی اطلاعات پرحجم مورد استفاده قرار می گیرد؛ اطلاعاتی که شامل فایل و یا پردازش می شود.

 

دلایل اهمیت هدوپ (hadoop):

امروزه سازمان های زیادی وجود دارند که به دنبال روشی برای جستجوی میلیونها صفحه وب و بازگشت نتایج مربوطه به هدوپت هستند. در این قسمت شما را با کاربردهای هدوپت آشنا خواهیم کرد:

 

  • امکان پردازش و ذخیره‌ی مقادیرداده با سرعت بالا:  این مورد برای زمانی که حجم افزایش یافته و داده ها به انواع مختلفی تقسیم می شوند مهم است.
  • قدرت پردازش: هدوپ قابلیت پردازش بالای داده های بزرگ را دارد .
  • میزان خطا: هدوپ داده ها را پردازش کرده و از برنامه ها در برابر خرابی سخت افزار محافظت می کند. به این صورت اگر یک گره خراب شود و از کار بیفتد، تمامی کارها به طور خودکار به گره های دیگر منتقل می شوند تا این اطمینان برایتان حاصل شود که محاسبات توزیع شده از کار نمی افتند. همچنین از تمام داده ها به صورت خودکار چندین نسخه ذخیره می شود.
  • انعطاف پذیری: در هدوپ می توانید اطلاعات را به اندازه ای که می خواهید ذخیره کرده و بعدا استفاده کنید. این مورد شامل داده های بدون ساختار مانند متن، تصاویر و فیلم ها می شود.
  • هزینه پایین: قالب منبع باز هدوپ آزاد است و از سخت افزار برای ذخیره ی داده ها با کمترین هزینه استفاده می شود.
  • مقیاس پذیری: شما می توانید سیستم تان را برای مدیریت داده های بیشتر، به آسانی و با اضافه کردن گره ها ارتقاء دهید.

 

چالش های استفاده از هدوپ (hadoop):

برنامه نویسی MapReduce راه حل همه ی مشکلات نیست:  برای تقاضاها و مشکلات ساده‌ی اطلاعاتی، که قابلیت تقسیم شدن به واحدهای مستقل را دارند کاربرد دارد، اما برای کارهای تحلیلی و تعاملی مناسب نیست. 

مهارت بالا نیاز دارد:  برای تهیه ی MapReduce ، پیدا کردن برنامه نویسانی که در جاوا مهارت کافی دارند بسی دشوار است.

امنیت داده ها : یکی دیگر از مراکز چالش پیرامون مسائل مرتبط به امنیت داده های پراکنده است، با اینکه ابزارها و تکنولوژی های جدید در حال ارائه هستند. پروتکل احراز هویت  Kerberos قدمی بزرگ در جهت ایمن سازی محیط های هدوپ است.

مدیریت کامل داده ها:  هدوپ از ابزارهای کاملاً کاربردی و آسان برای مدیریت داده ها، پاکسازی داده ها برخوردار نیست. به خصوص کمبود ابزار برای کیفیت داده ها و استاندارد سازی وجود ندارد.

هسته ی اصلی هدوپ به دو بخش ذخیره سازی و پردازش تقسیم می شود. هدوپ فایل ها را به بلوک های بزرگ می شکند و آن ها را بین نودهای یک خوشه توزیع می کند. در پردازش داده، بخش Map/Reduce بسته کدی را برای نودها ارسال می کنند تا پردازش را به صورت موازی انجام دهند. در این بخش نودها بر روی قسمتی از داده که در دسترس هستند، کار می کنند. بدین صورت داده ها سریع تر پردازش می شوند. هدوپ دارای قالب اصلی می باشد که شما را با آنها آشنا خواهیم کرد.

قالب اصلی هدوپ تشکیل شده از ماژول‌های زیر است:

بخش مشترکات هدوپ: شامل کتابخانه‌های جاوا می باشد و برای تمامی ماژول ها استفاده می شود.

سیستم فایل توزیع شده هدوپ (HDFS): یک سیستم فایل تقسیم شده است که داده را بر روی ماشین‌های خوشه ذخیره کرده و پهنای باند وسیعی را تولید می کنند.

 YARN هدوپ: یک پلتفرم مدیریت منابع است که مسئول مدیریت منابع محاسباتی در کامپیوترهای زیرمجموعه می باشد.

Map/Reduce  هدوپ: یک مدل برنامه‌نویسی برای پردازش و تجزیه و تحلیل داده در مقیاس‌های بالا است.

در واقع هدوپ یک سیستم فایل توزیع شده را تولید می‌کند که می‌تواند داده را بر روی چندین سرور ذخیره کند و وظیفه را بر روی این ماشین‌ها پخش کرده و کار را در کنار داده انجام می‌دهد.

 

هدوپ چگونه کار می کند ؟

هدوپ دسته‌های سازنده‌ای را فراهم می‌کند که کارها، خدمات و برنامه‌های دیگری بر روی آنها ساخته می‌شود. برنامه‌هایی که داده‌ها را در قالب‌های مختلف جمع آوری می‌کنند، می‌توانند داده‌ها را با استفاده از یک API برای اتصال به NameNode در سرور هدوپ قرار دهند.

سیستم هدوپ وظیفه مدیریت فضای نام فایل سیستم را بر عهده دارد و دسترسی کلاینت‌ها به فایل‌ها را تنظیم می‌کند NameNode .ها نیز وظایفی از جمله باز و بسته کردن ، تغییر نام فایل‌ها و فولدر‌ها را از طریق یک واسط برای فضای فایل سیستم انجام می دهد. هدوپ به وسیله ی ابزارها و برنامه های زیادی به جمع آوری ، ذخیره، پردازش، تجزیه و تحلیل و مدیریت داده‌های بزرگ می پردازد.

 

مقدمه :

معرفی دوره :

مختصری از دوره آموزش استفاده از پایگاه داده هدوپ (Hadoop) آنلاین

رایگان

فصل اول :

سر فصل 1

رایگان

فصل دوم :

سر فصل 2

رایگان

فصل سوم :

سر فصل 3

رایگان

فصل چهار :

سر فصل 4

رایگان

فصل پنج :

سر فصل 5

رایگان

مدرسان دوره

مهندس محمد پارسا مجد

مهندس محمد پارسا مجد بنیانگذار و مدیر عامل هلدینگ فرتاک

   همین الان ثبت نام کن