Phân loại luồng dữ liệu dựa trên học chuyển giao đa nguồn trong hệ thống mạng SDN phân tán

Nam Thang Hoang, Nguyễn Trần Lê Tuấn, Dương Công Sơn, Tống Văn Vạn, Trân Hải Anh
{"title":"Phân loại luồng dữ liệu dựa trên học chuyển giao đa nguồn trong hệ thống mạng SDN phân tán","authors":"Nam Thang Hoang, Nguyễn Trần Lê Tuấn, Dương Công Sơn, Tống Văn Vạn, Trân Hải Anh","doi":"10.54654/isj.v2i19.990","DOIUrl":null,"url":null,"abstract":"Tóm tắt— Ngày nay, phân loại luồng dữ liệu mạng đóng một vai trò quan trọng trong nhiều lĩnh vực như quản trị mạng, bảo mật, an toàn thông tin. Dữ liệu mạng mã hoá đang dần phổ biến, đơn cử như các dữ liệu của các nhà cung cấp dịch vụ lớn như Google, Facebook. Với các dữ liệu mạng bị mã hoá thì các phương pháp truyền thống như phân loại theo cổng (Port), theo kiểm tra gói sâu (DPI – Deep Packet Inspection) đã không còn hiệu quả, thay vào đó các phương pháp dựa vào học máy sẽ hiệu quả hơn. Gần đây các nghiên cứu về mạng định nghĩa bằng phần mềm SDN (Software Defined Networking) phân tán đã giúp giải quyết vấn đề nhất quán dữ liệu giữa các miền SDN. Từ đó vấn đề phân loại luồng dữ liệu trong mạng SDN phân tán có thể quy về việc phân loại như trên một miền, tuy nhiên trong trường hợp có một miền mạng SDN mới kết nối vào mạng SDN phân tán với số lượng ít các dữ liệu có thể dẫn tới kết quả phân loại không được tốt. Với lý do đó nhóm tác giả đã đề xuất giải thuật MMSTrAda, một giải thuật chuyển giao tri thức từ các miền mạng đã có nhiều dữ liệu sang miền mạng mới thành lập dựa trên giải thuật MSTradaBoost (TrAdaBoost đa nguồn). Kết quả phân loại dữ liệu mã hóa khi sử dụng giải pháp đề xuất để phân loại 3 loại dịch vụ E-commerce, Interactive data, Video on-demand trên miền mạng mới xuất hiện với chỉ số macro-F1 đều đạt trên 88%.","PeriodicalId":471638,"journal":{"name":"Nghiên cứu khoa học và công nghệ trong lĩnh vực an toàn thông tin","volume":"5 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2023-10-11","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Nghiên cứu khoa học và công nghệ trong lĩnh vực an toàn thông tin","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.54654/isj.v2i19.990","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0

Abstract

Tóm tắt— Ngày nay, phân loại luồng dữ liệu mạng đóng một vai trò quan trọng trong nhiều lĩnh vực như quản trị mạng, bảo mật, an toàn thông tin. Dữ liệu mạng mã hoá đang dần phổ biến, đơn cử như các dữ liệu của các nhà cung cấp dịch vụ lớn như Google, Facebook. Với các dữ liệu mạng bị mã hoá thì các phương pháp truyền thống như phân loại theo cổng (Port), theo kiểm tra gói sâu (DPI – Deep Packet Inspection) đã không còn hiệu quả, thay vào đó các phương pháp dựa vào học máy sẽ hiệu quả hơn. Gần đây các nghiên cứu về mạng định nghĩa bằng phần mềm SDN (Software Defined Networking) phân tán đã giúp giải quyết vấn đề nhất quán dữ liệu giữa các miền SDN. Từ đó vấn đề phân loại luồng dữ liệu trong mạng SDN phân tán có thể quy về việc phân loại như trên một miền, tuy nhiên trong trường hợp có một miền mạng SDN mới kết nối vào mạng SDN phân tán với số lượng ít các dữ liệu có thể dẫn tới kết quả phân loại không được tốt. Với lý do đó nhóm tác giả đã đề xuất giải thuật MMSTrAda, một giải thuật chuyển giao tri thức từ các miền mạng đã có nhiều dữ liệu sang miền mạng mới thành lập dựa trên giải thuật MSTradaBoost (TrAdaBoost đa nguồn). Kết quả phân loại dữ liệu mã hóa khi sử dụng giải pháp đề xuất để phân loại 3 loại dịch vụ E-commerce, Interactive data, Video on-demand trên miền mạng mới xuất hiện với chỉ số macro-F1 đều đạt trên 88%.
根据分布式SDN网络中的多源传输对数据流进行分类
简而言之——今天,网络数据流的分类在网络管理、安全、信息安全等领域起着至关重要的作用。网络加密数据正变得越来越普遍,就像谷歌、Facebook等大型服务提供商的数据一样。在加密的网络数据中,传统的方法,如端口分类、深度包检查,已经不再有效,取而代之的是机器学习方法。最近对分布式软件定义网络的研究帮助解决了SDN域之间数据一致性的问题。因此,在分布式SDN网络中对数据流进行分类的问题可以归结为在一个区域内进行分类,但是,如果有一个新的SDN网络域连接到分布式SDN网络中,数量较少的数据可能导致分类结果不太好。因此,作者团队提出了MMSTrAda算法,这是一种将知识从已有数据的网络转移到基于MSTradaBoost算法的新网络的算法。使用建议的解决方案对加密数据进行分类,对3种电子商务服务进行分类,交互式数据,在线视频点播,宏观f1指数均高于88%。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
求助全文
约1分钟内获得全文 求助全文
来源期刊
自引率
0.00%
发文量
0
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
确定
请完成安全验证×
copy
已复制链接
快去分享给好友吧!
我知道了
右上角分享
点击右上角分享
0
联系我们:info@booksci.cn Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。 Copyright © 2023 布克学术 All rights reserved.
京ICP备2023020795号-1
ghs 京公网安备 11010802042870号
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术官方微信