Жоғары оқу орнында білім алушыларды үлкен көлемді деректер бойынша даярлаудың практикалық негіздері (R программалау тілінде үлкен көлемді деректерді бөліктермен өңдеу)
DOI:
https://doi.org/10.52269/RWEP2522187Кілт сөздер:
үлкен көлемді деректер, үлкен көлемді деректер туралы талдаулар, R программалау ортасы, Nycflights13 пакеті, flights файлдарыАңдатпа
Мақалада үлкен деректер саласындағы мамандарды даярлау, R бағдарламалау ортасындағы үлкен деректерді өңдеу, сақтау және талдау негізінде жоғары оқу орындарындағы білім алушылардың білімін арттыру қарастырылады. Ұсынылған нәтижелер аппараттық және бағдарламалық қамтамасыз ету және бағдарламалау тілдері туралы білімді жан-жақты зерттеуге және білім беру мазмұнына енгізуге бағытталған зерттеу жұмысының бөлігі болып табылады. Студенттерді R тілінің пакеттерімен және деректерді сақтау форматтарымен таныстыруға ерекше назар аударылады. Деректерді екі түрлі жолмен .rds және .csv форматтарында сақтауға болатындығы және әрқайсысының үлкен деректерді өңдеу кезінде өзіндік ерекшеліктері мен артықшылықтары бар екендігі көрсетілген. Үлкен деректер құрылымдалған, жартылай құрылымдалған (XML және JSON) және құрылымдалмаған (мәтіндер, суреттер мен бейнелер) болып бөлінеді, бұл оларды сақтауды, өңдеуді және талдауды күрделендіреді. Міндет: R жадына толық деректер жиынтығын бірден жүктеу мүмкін болмаған жағдайын қарастыру. Үлкен деректерді талдау кезінде R жадына толық деректер жиынтығын бірден жүктеу мүмкін болмаған жағдайда деректерді фрагменттермен өңдеу мүмкіндігі және осы жағдайда Саймон Урбанек пен Тейлор Арнольдтың iotools пакетінің chunk.apply функциясының қолданылу жолдары қарастырылады. Үлкен көлемді деректер бойынша жоғары оқу орнында білім алушыларды даярлауға байланысты талдаулар жасалып, біздің зерттеу жұмысымыздың практикалық түрде жүзеге асырылуының нәтижелік жұмыстарынан мәліметтер келтірілді.