Exploring the Potential of Generative AI Chatbots as an A/B Testing Aid for UX Writing and Comparing the Results between Chatbots: Focusing on ChatGPT and BARD

Dahyun Kim, Yanghee Nam
{"title":"Exploring the Potential of Generative AI Chatbots as an A/B Testing Aid for UX Writing and Comparing the Results between Chatbots: Focusing on ChatGPT and BARD","authors":"Dahyun Kim, Yanghee Nam","doi":"10.37254/ids.2023.09.65.03.21","DOIUrl":null,"url":null,"abstract":"연구배경 UX 라이팅(Writing) 분야에서 A/B 테스트는 사용자에게 제공할 문구의 효과를 객관적으로 검증할 수 있도록 하여 적극적으로 활용되고 있다. 본 연구는 A/B 테스트에서 발견되는 주요 한계점에 주목하여 이를 보완하기 위한 방법으로 ChatGPT와 BARD로 대표되는 생성형 AI 챗봇의 활용 가능성을 탐색하고, 챗봇 간 결과를 비교하고자 하였다. 연구방법 먼저, 사용자 대상 및 생성형 AI 챗봇 대상으로 A/B 테스트를 진행하기 위해 테스트에 사용할 문항을 연구자가 작성하였다. 다음으로, 각각의 대상별로 A/B 테스트를 진행하여 응답을 수집하였다. 이후, 사용자 응답과 생성형 AI 챗봇의 답변을 분석하였다. 마지막으로, 두 대상의 응답을 비교하여 생성형 AI 챗봇의 사용자 선호 예측률을 확인하였고, 나아가 ChatGPT와 BARD의 결과를 비교하여 두 챗봇 간 차이 발생 여부를 살펴보았다. 연구결과 ChatGPT과 BARD 중 BARD의 사용자 선호 예측률이 더 높게 나타났고, 이러한 예측률의 차이는 기반 모델의 학습 과정의 미세 조정(fine-tuning)의 차이에서 비롯되었음을 짐작할 수 있었다. 한편 두 챗봇 모두 사용자가 선호하는 이유로 작성한 내용들을 포괄하여 예측 이유로 설명함을 확인할 수 있었다. 결론 본 연구는 실증적인 조사를 통해 생성형 AI 챗봇이 사용자가 선호하는 문구를 어느 정도 예측하고, 그 이유를 사용자 입장에서 충분히 설명할 수 있다는 것을 보여주었다. 따라서 생성형 AI 챗봇은 A/B 테스트의 보조 도구로 활용되어 UX 라이팅 과정에서 유용한 정보를 제공하는 데 기여할 수 있을 것으로 예측된다.","PeriodicalId":498232,"journal":{"name":"San-eob dija-inhag yeon-guji","volume":"125 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2023-09-30","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"San-eob dija-inhag yeon-guji","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.37254/ids.2023.09.65.03.21","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0

Abstract

연구배경 UX 라이팅(Writing) 분야에서 A/B 테스트는 사용자에게 제공할 문구의 효과를 객관적으로 검증할 수 있도록 하여 적극적으로 활용되고 있다. 본 연구는 A/B 테스트에서 발견되는 주요 한계점에 주목하여 이를 보완하기 위한 방법으로 ChatGPT와 BARD로 대표되는 생성형 AI 챗봇의 활용 가능성을 탐색하고, 챗봇 간 결과를 비교하고자 하였다. 연구방법 먼저, 사용자 대상 및 생성형 AI 챗봇 대상으로 A/B 테스트를 진행하기 위해 테스트에 사용할 문항을 연구자가 작성하였다. 다음으로, 각각의 대상별로 A/B 테스트를 진행하여 응답을 수집하였다. 이후, 사용자 응답과 생성형 AI 챗봇의 답변을 분석하였다. 마지막으로, 두 대상의 응답을 비교하여 생성형 AI 챗봇의 사용자 선호 예측률을 확인하였고, 나아가 ChatGPT와 BARD의 결과를 비교하여 두 챗봇 간 차이 발생 여부를 살펴보았다. 연구결과 ChatGPT과 BARD 중 BARD의 사용자 선호 예측률이 더 높게 나타났고, 이러한 예측률의 차이는 기반 모델의 학습 과정의 미세 조정(fine-tuning)의 차이에서 비롯되었음을 짐작할 수 있었다. 한편 두 챗봇 모두 사용자가 선호하는 이유로 작성한 내용들을 포괄하여 예측 이유로 설명함을 확인할 수 있었다. 결론 본 연구는 실증적인 조사를 통해 생성형 AI 챗봇이 사용자가 선호하는 문구를 어느 정도 예측하고, 그 이유를 사용자 입장에서 충분히 설명할 수 있다는 것을 보여주었다. 따라서 생성형 AI 챗봇은 A/B 테스트의 보조 도구로 활용되어 UX 라이팅 과정에서 유용한 정보를 제공하는 데 기여할 수 있을 것으로 예측된다.
探索生成式AI聊天机器人作为用户体验写作A/B测试辅助工具的潜力,并比较聊天机器人之间的结果:专注于ChatGPT和BARD
在研究背景UX照明(Writing)领域,A/B测试被积极应用,以客观验证提供给用户的句子效果。本研究注意到在A/B测试中发现的主要局限性,为了弥补这一缺陷,探索了以ChatGPT和BARD为代表的生成型AI聊天机器人的应用可能性,并试图比较聊天机器人之间的结果。研究方法首先,研究者制作了用于测试的问题,以用户和生成型AI聊天机器人为对象进行A/B测试。其次,对每个对象进行A/B测试,以收集答案。之后,他分析了用户的回答和生成型AI聊天机器人的回答。最后,比较两个对象的回答,确认了生成型AI聊天机器人的用户偏好预测率,进而比较ChatGPT和BARD的结果,观察两个聊天机器人之间是否会发生差异。研究结果表明,在ChatGPT和BARD中,BARD的用户偏好预测率更高,这种预测率的差异源于基础模型学习过程的微调(fine-tuning)的差异。另外,两个聊天机器人都以预测理由说明了用户喜欢的原因。结论本研究通过实证调查表明,生成型AI聊天机器人可以在一定程度上预测用户喜欢的句子,并从用户的立场上充分说明其理由。因此,生成型AI聊天机器人被用作A/B测试的辅助工具,可以在UX照明过程中提供有用的信息。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
求助全文
约1分钟内获得全文 求助全文
来源期刊
自引率
0.00%
发文量
0
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
确定
请完成安全验证×
copy
已复制链接
快去分享给好友吧!
我知道了
右上角分享
点击右上角分享
0
联系我们:info@booksci.cn Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。 Copyright © 2023 布克学术 All rights reserved.
京ICP备2023020795号-1
ghs 京公网安备 11010802042870号
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术官方微信