عجوة أو مجدول: مجموعة بيانات متوازنة الصنفين لتدريس تعلم الآلة

غسان بن فاروق باتي
{"title":"عجوة أو مجدول: مجموعة بيانات متوازنة الصنفين لتدريس تعلم الآلة","authors":"غسان بن فاروق باتي","doi":"10.5339/jist.2023.12","DOIUrl":null,"url":null,"abstract":"الملخص تعد المملكة العربية السعودية أحد أكبر منتجي التمور في العالم، وهي الدولة الأولى عالميّاً في مؤشر الإستراتيجية الحكومية للذكاء الاصطناعي، كما يعد تعلم الآلة واحداً من أكثر موضوعات الذكاء الاصطناعي انتشاراً وأهمية هذه الأيام، وهو أحد التقنيات الناشئة التي يُتوقع لها مستقبل باهر، خاصة في الثورة الصناعية الرابعة المرتكزة على الذكاء الاصطناعي وتطبيقاته التي تخدم البشرية في مجالات عديدة. ويوجد اهتمام حكومي في السعودية بتدريس الذكاء الاصطناعي وتعلم الآلة واستخدامهما لإنتاج جيل يبتكر حلولاً مبدعة. وكثير من مصادر هذا العلم إنجليزية، مع شح واضح في المصادر العربية؛ لذلك تسعى هذه الورقة لسد تلك الفجوة من خلال إنشاء مجموعة بيانات من بيئتنا السعودية باستخدام واحد من أسهل برامج تنقيب البيانات \"أورانج\" وموقع \"تيتشابل مشين\" اللذَّين لا يحتاجان إلى برمجة. وتتمثل أهمية الدراسة في التالي: أنه أول بحث ينشئ مجموعة بيانات متوازنة الصنفين لتصنيف التمور السعودية العضوية تتكون من ثلاث مجموعات فرعية: الأولى: تحوي البيانات المجدولة ذات الخصائص اليدوية لتصنيف التمور العضوية \"عجوة أو مجدول\"، والثانية: تجمع البيانات المجدولة ذات الخصائص المولدة أتوماتيكيّاً باستخدام التعلم العميق لتصنيف التمور العضوية \"عجوة أو مجدول\"، والثالثة: تجمع صوراً لتمور العجوة والمجدول، كما أنه أول بحث باللغة العربية يستخدم نماذج تعلم الآلة التقليدية والتعلم العميق لإنشاء نماذج ذات أداء عالٍ لتصنيف التمور السعودية العضوية بدون برمجة، مما يمكن الدارسين والباحثين والمطورين من تطوير تطبيقات تعلم آلة لتصنيف التمور السعودية بأشكال متنوعة في مواقع الإنترنت أو تطبيقات الجوالات أو في المتحكمات الدقيقة وتطبيقات إنترنت الأشياء وتعلم الآلات الصغيرة. Saudi Arabia is one of the world's largest producers of dates. Moreover, Saudi Arabia has been ranked first worldwide in the government strategy index for Artificial Intelligence. Machine learning is also one of the most widespread topics of artificial intelligence and one of the emerging technologies with a potential future paving the way for the fourth industrial revolution. The Saudi government is giving a primary importance to machine-learning teaching to produce a generation capable of creative solutions. However, many of the teaching sources of this discipline are in English, with an apparent lack of Arabic sources. Thus, this paper seeks to bridge this gap by creating a dataset generated from our Saudi environment using two of the easiest data mining platforms: Orange and Teachable Machine and none of them requires programming. This study is the first work to establish a balanced dataset to classify two categories of organic Saudi dates. The dataset contains three subsets: 1) a dataset containing hand-crafted features to classify two types of organic dates (Ajwa or Medjool); 2) a dataset containing tabular data with features created automatically using deep learning to classify the two organic date types (Ajwa or Medjool), and 3) a dataset for images of Ajwa and Medjool dates. In addition, this study is considered the first work in Arabic using shallow machine learning and deep learning to create accurate models for classifying organic Saudi dates, which would enable scholars, researchers, and developers to create machine learning applications for classifying Saudi dates in various forms like websites, mobile apps, microcontrollers, tiny machine learning and internet of things applications.","PeriodicalId":16179,"journal":{"name":"Journal of Information Studies & Technology (JIS&T)","volume":null,"pages":null},"PeriodicalIF":0.0000,"publicationDate":"2023-09-30","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Journal of Information Studies & Technology (JIS&T)","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.5339/jist.2023.12","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0

Abstract

الملخص تعد المملكة العربية السعودية أحد أكبر منتجي التمور في العالم، وهي الدولة الأولى عالميّاً في مؤشر الإستراتيجية الحكومية للذكاء الاصطناعي، كما يعد تعلم الآلة واحداً من أكثر موضوعات الذكاء الاصطناعي انتشاراً وأهمية هذه الأيام، وهو أحد التقنيات الناشئة التي يُتوقع لها مستقبل باهر، خاصة في الثورة الصناعية الرابعة المرتكزة على الذكاء الاصطناعي وتطبيقاته التي تخدم البشرية في مجالات عديدة. ويوجد اهتمام حكومي في السعودية بتدريس الذكاء الاصطناعي وتعلم الآلة واستخدامهما لإنتاج جيل يبتكر حلولاً مبدعة. وكثير من مصادر هذا العلم إنجليزية، مع شح واضح في المصادر العربية؛ لذلك تسعى هذه الورقة لسد تلك الفجوة من خلال إنشاء مجموعة بيانات من بيئتنا السعودية باستخدام واحد من أسهل برامج تنقيب البيانات "أورانج" وموقع "تيتشابل مشين" اللذَّين لا يحتاجان إلى برمجة. وتتمثل أهمية الدراسة في التالي: أنه أول بحث ينشئ مجموعة بيانات متوازنة الصنفين لتصنيف التمور السعودية العضوية تتكون من ثلاث مجموعات فرعية: الأولى: تحوي البيانات المجدولة ذات الخصائص اليدوية لتصنيف التمور العضوية "عجوة أو مجدول"، والثانية: تجمع البيانات المجدولة ذات الخصائص المولدة أتوماتيكيّاً باستخدام التعلم العميق لتصنيف التمور العضوية "عجوة أو مجدول"، والثالثة: تجمع صوراً لتمور العجوة والمجدول، كما أنه أول بحث باللغة العربية يستخدم نماذج تعلم الآلة التقليدية والتعلم العميق لإنشاء نماذج ذات أداء عالٍ لتصنيف التمور السعودية العضوية بدون برمجة، مما يمكن الدارسين والباحثين والمطورين من تطوير تطبيقات تعلم آلة لتصنيف التمور السعودية بأشكال متنوعة في مواقع الإنترنت أو تطبيقات الجوالات أو في المتحكمات الدقيقة وتطبيقات إنترنت الأشياء وتعلم الآلات الصغيرة. Saudi Arabia is one of the world's largest producers of dates. Moreover, Saudi Arabia has been ranked first worldwide in the government strategy index for Artificial Intelligence. Machine learning is also one of the most widespread topics of artificial intelligence and one of the emerging technologies with a potential future paving the way for the fourth industrial revolution. The Saudi government is giving a primary importance to machine-learning teaching to produce a generation capable of creative solutions. However, many of the teaching sources of this discipline are in English, with an apparent lack of Arabic sources. Thus, this paper seeks to bridge this gap by creating a dataset generated from our Saudi environment using two of the easiest data mining platforms: Orange and Teachable Machine and none of them requires programming. This study is the first work to establish a balanced dataset to classify two categories of organic Saudi dates. The dataset contains three subsets: 1) a dataset containing hand-crafted features to classify two types of organic dates (Ajwa or Medjool); 2) a dataset containing tabular data with features created automatically using deep learning to classify the two organic date types (Ajwa or Medjool), and 3) a dataset for images of Ajwa and Medjool dates. In addition, this study is considered the first work in Arabic using shallow machine learning and deep learning to create accurate models for classifying organic Saudi dates, which would enable scholars, researchers, and developers to create machine learning applications for classifying Saudi dates in various forms like websites, mobile apps, microcontrollers, tiny machine learning and internet of things applications.
缺陷或列表:一套平衡的数据集,用于教学机器学习
简言之,沙特阿拉伯是世界上最大的枣类生产国之一,是政府人工智能战略指数中世界上第一个国家,机器学习是当今最广泛和最重要的人工智能主题之一,也是一种新兴技术,预计将有辉煌的未来,特别是在第四次人工智能工业革命及其应用在许多领域为人类服务。在沙特阿拉伯,政府有兴趣教育人工智能,学习和使用人工智能来产生创新解决办法。许多国旗的许多来源是英文,阿拉伯来源明显不足;因此,本文件试图利用最简单的奥兰治”数据挖掘方案和不需要编程的的tchabbl”,从我们的环境中建立一个数据集,以弥补这一差距。这项研究的重要意义如下:第一项研究是为沙特阿拉伯有机枣分类建立一套平衡的分类数据集,由三个子类组成:第一,包含有有机枣类分类的手工特征的表列数据:第一个是:利用有机枣类分类的深度学习收集自动生成的有机枣类的数据;第三个是:这是第一个使用传统机械学习和深层学习模式的阿拉伯语研究,目的是在没有编程的情况下制作高性能的有机枣类分类模型,使学者、研究人员和开发人员能够开发各种形式的沙特枣类机器学习应用程序,包括网站、移动应用程序、微控制程序、物体互联网应用程序和小型机器学习。沙特阿拉伯王国;声明声明。在发展中国家和发展中国家之间的合作关系“科学”还介绍了与技术创新有关的创新办法,并为工业复兴开辟了空间。Saudi政府正在逐步实现对创新的的企业。根据《公约》第2条第2款(b)项和第2款(b)项的规定,委员会认为,《公约》第2款(b)项和第2款(b)项的规定,缔约国应采取适当的措施,以确保《公约》第3款的规定。例如,其他其他外,还介绍了对环境环境利用调查的研究:研究、培训和培训方案。这是一个关于对伊拉克武装部队的的的研究。(a)通过强迫劳动或强迫劳动)(2)提供数据,并提供数据和数据,用于确定有效有效地应对气候变化的后果(例如,或Medjool, 3)。在司法制度中,在司法制度中,在司法制度中,在司法制度中,在司法制度中,在司法制度中,在司法制度中,在司法制度中,在司法制度中,在司法制度中,在司法制度中,在司法制度中,在司法制度中,在司法制度中,在司法制度中,在司法制度中,在司法制度中,在司法制度中,在司法制度中,在司法制度中,在司法制度中,在司法制度中,在司法制度中,在司法制度中,在司法制度中,在司法制度中,在司法制度中,在司法制度中,在司法制度中,在司法制度中,在司法制度中,在司法制度中,在司法制度中。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
求助全文
约1分钟内获得全文 求助全文
来源期刊
自引率
0.00%
发文量
0
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
确定
请完成安全验证×
copy
已复制链接
快去分享给好友吧!
我知道了
右上角分享
点击右上角分享
0
联系我们:info@booksci.cn Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。 Copyright © 2023 布克学术 All rights reserved.
京ICP备2023020795号-1
ghs 京公网安备 11010802042870号
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术官方微信