پایگاه باز داده‌های آماری ایران؛ یک گام ارزشمند در خارج از ایران

0

اسمال مدیا یکی از شرکتهای موفق خارج از کشور است که در زمینه آزادی اطلاعات کار می کند. تازه ترین پروژه اسمال مدیا گردآوری داده های عمومی موسسات ایرانی است که مقدمه بسیار خوبی برای هر نوع مطالعه آماری است. پایگاه داده باز (که بهتر است “پایگاه باز داده‌ها” باشد) که همین تازگی رونمایی شده در آغاز راه است اما تداوم انباشت اطلاعات آن را به مخزنی مهم تبدیل خواهد کرد برای محققان. یادداشت زیر از بخش “درباره ما” از این پایگاه انتخاب شده است که به دو زبان فارسی و انگلیسی فعالیت می کند:

پایگاه داده باز ایران ابتکار مشترک افراد و سازمان‌هایی است که به موضوع داده باز و شفافیت علاقه‌مندند. اسمال مدیا (Small Media Foundation) با همکاری Development Seed این پایگاه را طراحی کرده است. پایگاه داده باز ایران مشتاق گسترش دامنه اعضای خود است، اگر به موضوع داده باز علاقه‌مندید لطفا با ما تماس بگیرید!‌

داده باز چیست؟

به زبان ساده و همانگونه که Open Data Institute تعریف می‌کند، داده باز داده‌ای است که «همه بتوانند به آن دسترسی داشته‌ باشند، از آن استفاده کنند و به اشتراک بگذارند». Open Knowledge International کتاب راهنمایی در مورد داده باز منتشر کرده و در آن توضیح می‌دهد که داده در صورتی باز به حساب می‌آید که از سه اصل اساسی زیر تبعیت کند:

  • در دسترس باشد، با هزینه‌ای معقول برای باز تولید آن.
  • استفاده و توزیع مجدد آن امکان‌پذیر باشد، به این معنی که مجوز آن اجازه‌ی استفاده و توزیع مجدد آن را بدهد.
  • امکان مشارکت همگانی داشته باشد، به این معنی که استفاده، استفاده مجدد و توزیع دوباره داده‌ها محدودیتی نداشته باشد.

چرا پایگاه داده باز ایران؟

سازمان‌های دولتی و غیردولتی در ایران در همه سطوح -شهری، استانی و ملی- داده‌های عمومی فراوانی منتشر می‌کنند. اما در بسیاری از مواقع این داده‌ها به راحتی در دسترس نیستند: یا در فرمت‌های غیرقابل دسترس مانند پی‌دی‌اف یا عکس عرضه شده‌اند،‌ یا در پس لایه‌های مختلف وبسایت‌های رسمی آمده‌اند یا اصلا در قالب دیجیتال عرضه نشده‌اند.

پایگاه داده باز ایران قصد دارد داده‌های دولتی و غیردولتی را در یک جا جمع کرده و آن‌ها را در قالب‌هایی که با ماشین قابل خواندن باشند (مانند CSV یا JSON) در یک کانون مرکزی ارائه دهد. هدف ما این است که به پایگاه آنلاین معتبر داده برای محققان، خبرنگاران و شهروندان ایرانی تبدیل شویم؛ و معتقدیم وجود چنین پایگاهی به افراد کمک می‌کند تا عملکرد و سیاست‌های دولت خود را بهتر درک کنند.

باز و رایگان بودن داده یکی از ویژگی‌های کلیدی دولت پاسخگو و مسئول است. در این مسیر، پایگاه داده باز ایران امیدوار است بتواند حوزه‌هایی را که مسئولان ایرانی می‌توانند شفافیت فعالیت‌های خود را بالا ببرند، برجسته کند. این کار با در اختیار عموم گذاشتن داده و دسترسی راحت به داده‌ها ممکن است.

روش کار ما چیست؟

یک پایگاه داده باز، خود نیز باید باز باشد. یکی از ویژگی‌های برجسته پایگاه داده باز ایران این است که همه‌ی فرآیند تکنولوژی و معماری پلتفرم آن بر روی گیت‌هاب به صورت عمومی قابل دسترس است. کدهای سایت در اینجا در دسترس است، مشخصات داده‌ها و همه اطلاعات در مورد داده‌های موجود را نیز اینجا می‌توان دید.

روش جمع‌آوری و تمیز کردن داده (که به آن اصطلاحا تمیزکاری داده یا data ingest می‌گوییم) به ماهیت مجموعه داده بستگی دارد. در برخی موارد ممکن است که اسکریپت خودکار (Automated Script) طراحی کنیم تا کار را برای ما انجام دهد. کد همه اسکریپت‌هایی که طراحی می‌کنیم اینجا در دسترس خواهند بود.

برای به دست آوردن داده‌هایی که در فرمت‌های ناخوانا و پیچیده در دسترس هستند نیز از ابزارهای مختلف استفاده می‌کنیم. به عنوان مثال، برای داده‌هایی که به صورت پی‌دی‌اف عرضه شده‌اند در حال حاضر از Tabula استفاده می‌کنیم که فرایندی دستی است.

چه‌طور می‌توانم در پروژه مشارکت کنم؟

راه‌های مختلفی برای مشارکت در پروژه وجود دارد:

مجموعه داده‌های خود را منتشر کنید: اگر داده‌های تمیز شده دارید و می‌خواهید آن‌ها را منتشر کنید، می‌توانید آن‌را برای ما بفرستید. لطفا به همراه داده‌های خود، روش جمع آوری داده‌ها را نیز که برای تمیز کردن داده‌ها استفاده کرده‌اید، بفرستید.

مجموعه داده پیشنهاد دهید:‌ دنبال مجموعه داده‌ای هستید و این‌جا پیدایش نمی‌کنید؟ اگر مجموعه داده‌ای سراغ دارید که فکر می‌کنید باید در پایگاه داده باز ایران در دسترس باشد، لطفا آن را به ما پیشنهاد دهید. اگر مجموعه داده جالب باشد، آن را در لیست کارهایمان می‌گذاریم.

کد تمیزکاری داده (ingest code) بنویسید: اگر برنامه‌نویس هستید و می‌خواهید در نوشتن کد تمیزکاری داده به ما کمک کنید، لطفا با ما تماس بگیرید!‌

از ما حمایت کنید: در حال حاضر اسمال مدیا حامی پایگاه داده باز ایران است، اما دوست داریم حامیان مالی خود را گسترش دهیم. اگر می‌توانید کمک کنید، لطفا با ما تماس بگیرید!‌

*نشانی پایگاه:
http://iranopendata.org/fa/
داده های در دسترس:
http://iranopendata.org/fa/datasets/

*برخی از فونت های فارسی و هم انگلیسی در فرمت هایی که برای بارگذاری انتخاب شده بخوبی نمایش داده نمی شود. ایرادی که امیدوارم بزودی رفع شود. – م.ج

Print Friendly, PDF & Email
Share.

نظرتان را بنویسید

%d وب‌نوشت‌نویس این را دوست دارند: