• <em id="6vhwh"><rt id="6vhwh"></rt></em>

    <style id="6vhwh"></style>

    <style id="6vhwh"></style>
    1. <style id="6vhwh"></style>
        <sub id="6vhwh"><p id="6vhwh"></p></sub>
        <p id="6vhwh"></p>
          1. 国产亚洲欧洲av综合一区二区三区 ,色爱综合另类图片av,亚洲av免费成人在线,久久热在线视频精品视频,成在人线av无码免费,国产精品一区二区久久毛片,亚洲精品成人片在线观看精品字幕 ,久久亚洲精品成人av秋霞

            filesplit

            更新時間:2023-03-01 17:33:52 閱讀: 評論:0

            當只有一臺機器可用時,一些數據科學愛好者在處理大型數據文件時遇到了困難。文件大小可能會超過計算機中的可用內存。在大多數數據科學項目中,可以對文件進行拆分處理,以獲得機器學習模型所需的數據。例如,按操作分組以獲得均值、中位數、最大值、求和或其他值。這將生成一個可以在內存中處理的較小版本的文件。現在的任務是如何將大文件分割成更小的塊。

            熟悉unix的人會說,使用shell命令或awk可以很容易地完成。文件可以按行、列、列值、大小等進行拆分。以下是兩個常見的例子:

            1.Unix命令按行數拆分myfile。-l參數定義每個拆分中的最大行數。輸出文件如splitfileaa,splitfileab等。

            split -l 500 myfile splitfile

            2. Unix命令按文件大小拆分。-b參數定義輸出的文件大小。同樣,輸出將具有上面示例中的名稱。

            split -b 40k myfile splitfile

            注意,unix中的awk命令可用于創建按列中的值拆分的不同文件。

            將數據拆分到更小的部分后,機器學習開發者就可以在一臺機器上進行處理。python中的panda有能力處理這些情況。下面是一個以塊的形式讀取大文件并動態處理的例子。Python代碼示例如下:

            import pandas as pd# Split data into smaller chunks and process in partschunk_size = 100000required_data = pd.DataFrame()for data in pd.read_csv(myfile,chunksize = chunk_size): data["datetime"]= pd.to_datetime(data["timestamp"],unit = 's') data["datetime"]=data["datetime"].dt.tz_localize('UTC').dt.tz_convert('Asia/Kolkata') data["date"] =data["datetime"].dt.date data["week"] =data["datetime"].dt.week data["hour"] = data["datetime"].dt.hour data["weekday"] = data["datetime"].dt.day_name() required_data_chunk = data.groupby(["id","date","week","weekday","hour"])["datetime"].count() required_data_chunk = pd.DataFrame(required_data_chunk) required_data_chunk.ret_index(inplace=True) required_data = required_data.append(required_data_chunk)# Merge the procesd data splits into one filerequired_data_final = required_data[["id","date","week","weekday","hour","datetime"]].groupby( ["driver_id","date","week","weekday","hour"])["datetime"].sum()required_data_final = pd.DataFrame(required_data_final)required_data_final.ret_index(inplace=True)

            對于R用戶,可以使用包,如data.table。

            本文發布于:2023-02-28 20:13:00,感謝您對本站的認可!

            本文鏈接:http://www.newhan.cn/zhishi/a/167766323281826.html

            版權聲明:本站內容均來自互聯網,僅供演示用,請勿用于商業和其他非法用途。如果侵犯了您的權益請與我們聯系,我們將在24小時內刪除。

            本文word下載地址:filesplit.doc

            本文 PDF 下載地址:filesplit.pdf

            下一篇:返回列表
            標簽:filesplit
            相關文章
            留言與評論(共有 0 條評論)
               
            驗證碼:
            推薦文章
            排行榜
            Copyright ?2019-2022 Comsenz Inc.Powered by ? 實用文體寫作網旗下知識大全大全欄目是一個全百科類寶庫! 優秀范文|法律文書|專利查詢|
            主站蜘蛛池模板: 香蕉EEWW99国产精选免费| 国产农村老熟女乱子综合| 噜噜噜亚洲色成人网站∨| freechinese麻豆| 国产精品剧情亚洲二区| 一区二区三区鲁丝不卡| 日本久久一区二区三区高清| 国产精品疯狂输出jk草莓视频| 亚洲成av人无码免费观看| 国产AV无码专区亚洲AV紧身裤| 无码区日韩专区免费系列| 国产成人午夜一区二区三区| 国产综合久久久久鬼色| 国产人妻精品午夜福利免费| 国产在线拍揄自揄视频网试看| 亚洲高清免费在线观看| 国产精品老熟女露脸视频| 国产对白老熟女正在播放| 亚洲avav天堂av在线网爱情| 国产自在自线午夜精品 | 国产情侣激情在线对白| 免费A级毛片中文字幕| 国产福利一区二区三区在线观看 | 午夜国产小视频| 国产精品毛片一区二区三| 青青草原国产精品啪啪视频| 亚洲伊人久久综合成人| 亚洲精品国产一区二区在线观看 | 性男女做视频观看网站| 亚洲AV成人片在线观看| 免费看的一级黄色片永久| 国产精品无码素人福利不卡| 少妇宾馆粉嫩10p| 久久久久亚洲AV成人片一区 | 亚洲av成人无码精品电影在线| 小嫩批日出水无码视频免费| 久热这里只有精品12| av无码电影在线看免费| 熟女女同亚洲女同中文字幕| 999精品全免费观看视频| 久久久久四虎精品免费入口|