{"title":"代表性历史语料库中采样框架的重要性:以巴黎戏剧为例","authors":"Angus B. Grieve-Smith","doi":"10.4000/COGNITEXTES.1671","DOIUrl":null,"url":null,"abstract":"Pour tester les hypotheses avancees par la linguistique cognitive, il n’y a pas d’instrument plus efficace que le corpus. L’echantillonnage representatif (Laplace 1814) est une technique qui permet d’examiner des corpus plus reduits, et ainsi plus abordables, et d’en generaliser les resultats a un cadre d’echantillonnage plus large. Or, un echantillon n’est pas pertinent a une hypothese s’il n’est pas tire d’un cadre d’echantillonnage qui soit lui-meme pertinent a l’hypothese.Dans mon projet doctoral (Grieve-Smith 2009) j’ai employe le corpus FRANTEXT (CNRTL 2018) pour tester l’hypothese selon laquelle l’extension analogique d’une construction depend de sa frequence de type (Bybee 1995). J’ai compare les textes theâtraux dans FRANTEXT pour les annees 1800-1815 avec un nouveau Corpus de la Scene Parisienne, un echantillon tire du catalogue de Wicks (1950 et seq.). Dans ce nouveau corpus, les negations de phrase declarative se forment avec ne … pas dans 73,9 % des instances, tandis que dans FRANTEXT elles ne se forment avec ne … pas que dans 50,5 % des occurrences, une difference qui montre un biais en faveur de la langue litteraire dans FRANTEXT. Pour une evaluation adequate des theories basees sur l’usage concernant le changement linguistique, il faudra un corpus contenant des textes representatifs de la langue sur un siecle au minimum.","PeriodicalId":53774,"journal":{"name":"CogniTextes","volume":"1 1","pages":""},"PeriodicalIF":0.1000,"publicationDate":"2019-06-17","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":"{\"title\":\"The importance of sampling frames in representative historical corpora : a case study of Parisian theater\",\"authors\":\"Angus B. Grieve-Smith\",\"doi\":\"10.4000/COGNITEXTES.1671\",\"DOIUrl\":null,\"url\":null,\"abstract\":\"Pour tester les hypotheses avancees par la linguistique cognitive, il n’y a pas d’instrument plus efficace que le corpus. L’echantillonnage representatif (Laplace 1814) est une technique qui permet d’examiner des corpus plus reduits, et ainsi plus abordables, et d’en generaliser les resultats a un cadre d’echantillonnage plus large. Or, un echantillon n’est pas pertinent a une hypothese s’il n’est pas tire d’un cadre d’echantillonnage qui soit lui-meme pertinent a l’hypothese.Dans mon projet doctoral (Grieve-Smith 2009) j’ai employe le corpus FRANTEXT (CNRTL 2018) pour tester l’hypothese selon laquelle l’extension analogique d’une construction depend de sa frequence de type (Bybee 1995). J’ai compare les textes theâtraux dans FRANTEXT pour les annees 1800-1815 avec un nouveau Corpus de la Scene Parisienne, un echantillon tire du catalogue de Wicks (1950 et seq.). Dans ce nouveau corpus, les negations de phrase declarative se forment avec ne … pas dans 73,9 % des instances, tandis que dans FRANTEXT elles ne se forment avec ne … pas que dans 50,5 % des occurrences, une difference qui montre un biais en faveur de la langue litteraire dans FRANTEXT. Pour une evaluation adequate des theories basees sur l’usage concernant le changement linguistique, il faudra un corpus contenant des textes representatifs de la langue sur un siecle au minimum.\",\"PeriodicalId\":53774,\"journal\":{\"name\":\"CogniTextes\",\"volume\":\"1 1\",\"pages\":\"\"},\"PeriodicalIF\":0.1000,\"publicationDate\":\"2019-06-17\",\"publicationTypes\":\"Journal Article\",\"fieldsOfStudy\":null,\"isOpenAccess\":false,\"openAccessPdf\":\"\",\"citationCount\":\"0\",\"resultStr\":null,\"platform\":\"Semanticscholar\",\"paperid\":null,\"PeriodicalName\":\"CogniTextes\",\"FirstCategoryId\":\"1085\",\"ListUrlMain\":\"https://doi.org/10.4000/COGNITEXTES.1671\",\"RegionNum\":0,\"RegionCategory\":null,\"ArticlePicture\":[],\"TitleCN\":null,\"AbstractTextCN\":null,\"PMCID\":null,\"EPubDate\":\"\",\"PubModel\":\"\",\"JCR\":\"Q4\",\"JCRName\":\"LINGUISTICS\",\"Score\":null,\"Total\":0}","platform":"Semanticscholar","paperid":null,"PeriodicalName":"CogniTextes","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.4000/COGNITEXTES.1671","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"Q4","JCRName":"LINGUISTICS","Score":null,"Total":0}
The importance of sampling frames in representative historical corpora : a case study of Parisian theater
Pour tester les hypotheses avancees par la linguistique cognitive, il n’y a pas d’instrument plus efficace que le corpus. L’echantillonnage representatif (Laplace 1814) est une technique qui permet d’examiner des corpus plus reduits, et ainsi plus abordables, et d’en generaliser les resultats a un cadre d’echantillonnage plus large. Or, un echantillon n’est pas pertinent a une hypothese s’il n’est pas tire d’un cadre d’echantillonnage qui soit lui-meme pertinent a l’hypothese.Dans mon projet doctoral (Grieve-Smith 2009) j’ai employe le corpus FRANTEXT (CNRTL 2018) pour tester l’hypothese selon laquelle l’extension analogique d’une construction depend de sa frequence de type (Bybee 1995). J’ai compare les textes theâtraux dans FRANTEXT pour les annees 1800-1815 avec un nouveau Corpus de la Scene Parisienne, un echantillon tire du catalogue de Wicks (1950 et seq.). Dans ce nouveau corpus, les negations de phrase declarative se forment avec ne … pas dans 73,9 % des instances, tandis que dans FRANTEXT elles ne se forment avec ne … pas que dans 50,5 % des occurrences, une difference qui montre un biais en faveur de la langue litteraire dans FRANTEXT. Pour une evaluation adequate des theories basees sur l’usage concernant le changement linguistique, il faudra un corpus contenant des textes representatifs de la langue sur un siecle au minimum.