{"title":"根据自动学习技术衡量发现垃圾邮件在短信服务中的有效性","authors":"أحمد أحمد عثمان, محمد بدوي مصطفى الخليفة","doi":"10.26389/ajsrp.n020123","DOIUrl":null,"url":null,"abstract":"مع زيادة استخدام الهواتف المحمولة، زاد استخدام خدمة الرسائل القصيرة بشكل هائل أدى إلى انخفاض تكلفة الرسائل النصية، بدأ الناس في استخدامها لأغراض ترويجية وأنشطة غير أخلاقية. مما أدى ذلك أيضاً إلى زيادة هائلة في الرسائل العشوائية (Spam) وبالتالي يحصل فقدان البيانات الشخصية والمالية. ولمنع فقدان البيانات من الضروري اكتشاف الرسائل العشوائية في أسرع وقت ممكن. تهدف هذه الورقة إلى تصنيف الرسائل العشوائية ليس فقط بشكل فعال، ولكن أيضًا في وقت قصير ، كما انه يعد هذا البحث قابل للتطبيق في الدول الناطقة باللغة الإنجليزية او يتم ارسال الرسائل النصية فيها للمستخدمين باللغة الإنجليزية حتى يومنا هذا. تم استخدام مجموعة بيانات تحتوي على آلاف الرسائل النصية التي تحتوي على رسائل نصية (Ham) ورسائل نصية عشوائية (Spam). تم استخدام تقنيات معالجة اللغة الطبيعية وخوارزميات تعلم الآلة (مصنف بايز الساذج(Naive Bayes ) وشجرة القرار((Decision Tre والغابة العشوائية Random Forest))) التي يمكننا من خلالها تصنيف نوع الرسالة. بعد تطبيق هذه الخوارزميات، حصلت خوارزمية Random Forest على أفضل دقة 0.99% في 0.15 ثواني.","PeriodicalId":15747,"journal":{"name":"Journal of engineering sciences and information technology","volume":"17 1","pages":""},"PeriodicalIF":0.0000,"publicationDate":"2023-03-30","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":"{\"title\":\"قياس فعالية نموذج اكتشاف الرسائل غير المرغوب فيها في خدمة الرسائل القصيرة استناداً على تقنيات التعلم الآلي\",\"authors\":\"أحمد أحمد عثمان, محمد بدوي مصطفى الخليفة\",\"doi\":\"10.26389/ajsrp.n020123\",\"DOIUrl\":null,\"url\":null,\"abstract\":\"مع زيادة استخدام الهواتف المحمولة، زاد استخدام خدمة الرسائل القصيرة بشكل هائل أدى إلى انخفاض تكلفة الرسائل النصية، بدأ الناس في استخدامها لأغراض ترويجية وأنشطة غير أخلاقية. مما أدى ذلك أيضاً إلى زيادة هائلة في الرسائل العشوائية (Spam) وبالتالي يحصل فقدان البيانات الشخصية والمالية. ولمنع فقدان البيانات من الضروري اكتشاف الرسائل العشوائية في أسرع وقت ممكن. تهدف هذه الورقة إلى تصنيف الرسائل العشوائية ليس فقط بشكل فعال، ولكن أيضًا في وقت قصير ، كما انه يعد هذا البحث قابل للتطبيق في الدول الناطقة باللغة الإنجليزية او يتم ارسال الرسائل النصية فيها للمستخدمين باللغة الإنجليزية حتى يومنا هذا. تم استخدام مجموعة بيانات تحتوي على آلاف الرسائل النصية التي تحتوي على رسائل نصية (Ham) ورسائل نصية عشوائية (Spam). تم استخدام تقنيات معالجة اللغة الطبيعية وخوارزميات تعلم الآلة (مصنف بايز الساذج(Naive Bayes ) وشجرة القرار((Decision Tre والغابة العشوائية Random Forest))) التي يمكننا من خلالها تصنيف نوع الرسالة. بعد تطبيق هذه الخوارزميات، حصلت خوارزمية Random Forest على أفضل دقة 0.99% في 0.15 ثواني.\",\"PeriodicalId\":15747,\"journal\":{\"name\":\"Journal of engineering sciences and information technology\",\"volume\":\"17 1\",\"pages\":\"\"},\"PeriodicalIF\":0.0000,\"publicationDate\":\"2023-03-30\",\"publicationTypes\":\"Journal Article\",\"fieldsOfStudy\":null,\"isOpenAccess\":false,\"openAccessPdf\":\"\",\"citationCount\":\"0\",\"resultStr\":null,\"platform\":\"Semanticscholar\",\"paperid\":null,\"PeriodicalName\":\"Journal of engineering sciences and information technology\",\"FirstCategoryId\":\"1085\",\"ListUrlMain\":\"https://doi.org/10.26389/ajsrp.n020123\",\"RegionNum\":0,\"RegionCategory\":null,\"ArticlePicture\":[],\"TitleCN\":null,\"AbstractTextCN\":null,\"PMCID\":null,\"EPubDate\":\"\",\"PubModel\":\"\",\"JCR\":\"\",\"JCRName\":\"\",\"Score\":null,\"Total\":0}","platform":"Semanticscholar","paperid":null,"PeriodicalName":"Journal of engineering sciences and information technology","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.26389/ajsrp.n020123","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
قياس فعالية نموذج اكتشاف الرسائل غير المرغوب فيها في خدمة الرسائل القصيرة استناداً على تقنيات التعلم الآلي
مع زيادة استخدام الهواتف المحمولة، زاد استخدام خدمة الرسائل القصيرة بشكل هائل أدى إلى انخفاض تكلفة الرسائل النصية، بدأ الناس في استخدامها لأغراض ترويجية وأنشطة غير أخلاقية. مما أدى ذلك أيضاً إلى زيادة هائلة في الرسائل العشوائية (Spam) وبالتالي يحصل فقدان البيانات الشخصية والمالية. ولمنع فقدان البيانات من الضروري اكتشاف الرسائل العشوائية في أسرع وقت ممكن. تهدف هذه الورقة إلى تصنيف الرسائل العشوائية ليس فقط بشكل فعال، ولكن أيضًا في وقت قصير ، كما انه يعد هذا البحث قابل للتطبيق في الدول الناطقة باللغة الإنجليزية او يتم ارسال الرسائل النصية فيها للمستخدمين باللغة الإنجليزية حتى يومنا هذا. تم استخدام مجموعة بيانات تحتوي على آلاف الرسائل النصية التي تحتوي على رسائل نصية (Ham) ورسائل نصية عشوائية (Spam). تم استخدام تقنيات معالجة اللغة الطبيعية وخوارزميات تعلم الآلة (مصنف بايز الساذج(Naive Bayes ) وشجرة القرار((Decision Tre والغابة العشوائية Random Forest))) التي يمكننا من خلالها تصنيف نوع الرسالة. بعد تطبيق هذه الخوارزميات، حصلت خوارزمية Random Forest على أفضل دقة 0.99% في 0.15 ثواني.