您的位置:首頁 > 軟件教程 > 教程 > 使用C#爬取快手作者主頁,并下載視頻/圖集(附源碼及軟件下載鏈接)

使用C#爬取快手作者主頁,并下載視頻/圖集(附源碼及軟件下載鏈接)

來源:好特整理 | 時間:2024-08-26 10:15:38 | 閱讀:148 |  標簽: 鏈接 C 主頁 快手 軟件 視頻   | 分享到:

最近發(fā)現(xiàn)一些快手的作者,作品還不錯,出于學習研究的目的,決定看一下怎么爬取數(shù)據(jù)。現(xiàn)在網(wǎng)上有一些爬蟲工具,不過大部分都失效了,或者不開源。于是自己就寫了一個小工具。先看一下成果: 軟件只需要填寫作者uid以及網(wǎng)頁版的請求Cookie,即可實現(xiàn)自動下載,下載目錄在程序根目錄下的Download文件夾。

最近發(fā)現(xiàn)一些快手的作者,作品還不錯,出于學習研究的目的,決定看一下怎么爬取數(shù)據(jù),F(xiàn)在網(wǎng)上有一些爬蟲工具,不過大部分都失效了,或者不開源。于是自己就寫了一個小工具。先看一下成果:
使用C#爬取快手作者主頁,并下載視頻/圖集(附源碼及軟件下載鏈接)
使用C#爬取快手作者主頁,并下載視頻/圖集(附源碼及軟件下載鏈接)
軟件只需要填寫作者uid以及網(wǎng)頁版的請求Cookie,即可實現(xiàn)自動下載,下載目錄在程序根目錄下的Download文件夾。
由于快手的風控比較厲害,軟件也做了應對措施。不過需要用戶點擊軟件中的提示文字,復制粘貼到瀏覽器,把請求的json保存到本地文件。使用軟件提供的解析本地json按鈕解析下載即可。如果返回的json文件很短或者沒有數(shù)據(jù),需要在快手的任意一個頁面刷新一下,也就是告訴快手風控,現(xiàn)在是正常瀏覽,沒有機器人的行為。

下面說一下構(gòu)建整個App的思路。

1. 快手網(wǎng)頁端準備

  1. 打開 https://live.kuaishou.com/ ,在頂部搜索你要爬取的作者昵稱,進入作者主頁。也可以從App端分享作者的主頁鏈接,粘貼進來。作者主頁加載完成后,地址欄的地址一定要是類似: https://live.kuaishou.com/profile/xxxxxx。 后面的xxxxxx就是作者的user id。這個記住,復制出來,后面會用到。

  2. 按F12打開瀏覽器的開發(fā)者工具(我之前就說過開發(fā)者工具是好東西,研究爬蟲必備,一定要好好學習)。

  3. 選擇開發(fā)者工具頂部的“網(wǎng)絡”,“全部”,如圖所示。在請求列表中找到user id,點擊它,右面就會出來請求的標頭。里面有個Cookie,需要記住,復制出來。如果沒有的話,記得刷新頁面。
    使用C#爬取快手作者主頁,并下載視頻/圖集(附源碼及軟件下載鏈接)

  4. 在列表里面可以看到很多請求,我們需要從中找到網(wǎng)頁端展示作品列表的那條請求,即public開頭的,或者直接在左上角搜索public,即可過濾絕大部分無關請求。這個請求的響應數(shù)據(jù)里面有作者作品的完整json響應。
    使用C#爬取快手作者主頁,并下載視頻/圖集(附源碼及軟件下載鏈接)

你可以右擊它,在新標簽頁面打開,打開后地址欄會顯示完成的瀏覽器請求地址。這個網(wǎng)址需要記住,后續(xù)會用到。那個count默認是12或者20,我們用到時候,直接拉滿,9999即可。
使用C#爬取快手作者主頁,并下載視頻/圖集(附源碼及軟件下載鏈接)
使用C#爬取快手作者主頁,并下載視頻/圖集(附源碼及軟件下載鏈接)

2. Postman攔截請求,模擬請求,并生成C#請求代碼

  1. 安裝postman interceptor攔截器,安裝地址 https://chromewebstore.google.com/detail/postman-interceptor/aicmkgpgakddgnaphhhpliifpcfhicfo 不得不說,這又是一個神器,搭配開發(fā)者工具,理論上可以搞定幾乎所有的爬蟲需求了。

  2. 打開Postman,點擊右下角的Start Proxy,
    使用C#爬取快手作者主頁,并下載視頻/圖集(附源碼及軟件下載鏈接)
    開啟攔截后,重新回到網(wǎng)頁版作者主頁,刷新一下頁面,等頁面加載完成后,點擊停止攔截。否則列表會一直增多,因為他會攔截電腦的所有網(wǎng)絡請求。這時Postman攔截器就會攔截到一大堆請求,同理,找到public請求,或者在左上角輸入public,即可過濾出來我們需要的。
    使用C#爬取快手作者主頁,并下載視頻/圖集(附源碼及軟件下載鏈接)
    點擊這個請求鏈接
    使用C#爬取快手作者主頁,并下載視頻/圖集(附源碼及軟件下載鏈接)
    這是Postman會打開一個新的窗口,包含了請求這個鏈接的所有參數(shù)以及標頭信息。
    使用C#爬取快手作者主頁,并下載視頻/圖集(附源碼及軟件下載鏈接)
    點擊Postman最右面的代碼工具即可生成我們需要的代碼。你可以選擇C#、python、js、curl等等。
    使用C#爬取快手作者主頁,并下載視頻/圖集(附源碼及軟件下載鏈接)

3. 使用WPF寫界面以及下載邏輯

  1. 新建WPF工程,為了界面好看,這次我用了開源的WPF UI,之前用過HandyControl、MicaWPF,這些都是不錯的UI控件庫。
    下載使用了開源的Downloader,請求使用了RestSharp,解析Json使用NewtonsoftJson,另外推薦一個免費的圖標庫FlatIcon。
    界面如下:
點擊查看代碼
http://schemas.microsoft.com/winfx/2006/xaml/presentation"
  xmlns:x="http://schemas.microsoft.com/winfx/2006/xaml"
  xmlns:d="http://schemas.microsoft.com/expression/blend/2008"
  xmlns:local="clr-namespace:KuaishouDownloader"
  xmlns:mc="http://schemas.openxmlformats.org/markup-compatibility/2006"
  xmlns:ui="http://schemas.lepo.co/wpfui/2022/xaml"
  Title="MainWindow"
  Width="900"
  Height="760"
  ExtendsContentIntoTitleBar="True"
  WindowBackdropType="Mica"
  WindowCornerPreference="Default"
  WindowStartupLocation="CenterScreen"
  mc:Ignorable="d">
  
    
      
      
    
    
    
    
    
      
        
      
      
      
        
        https://www.kuaishou.com/profile/xxxxxx/開頭的,復制xxxxxx過來" />
      
      
        
        
      
      
        
        
      
      
      
        
          
          
        
      
    
    
      
      
    
    
    
      
    
  


  1. 后臺邏輯沒有使用MVVM,就是圖方便。
點擊查看代碼
using KuaishouDownloader.Models;
using Newtonsoft.Json;
using RestSharp;
using System.Diagnostics;
using System.IO;
using System.Text.RegularExpressions;
using System.Windows;
using Wpf.Ui;
using Wpf.Ui.Controls;

namespace KuaishouDownloader
{
    /// 
    /// Interaction logic for MainWindow.xaml
    /// 
    public partial class MainWindow
    {
        string downloadFolder = AppContext.BaseDirectory;
        SnackbarService? snackbarService = null;

        public MainWindow()
        {
            InitializeComponent();
            this.Loaded += MainWindow_Loaded;
        }

        private void MainWindow_Loaded(object sender, RoutedEventArgs e)
        {
            snackbarService = new SnackbarService();
            snackbarService.SetSnackbarPresenter(snackbarPresenter);

            if (File.Exists("AppConfig.json"))
            {
                var model = JsonConvert.DeserializeObject(File.ReadAllText("AppConfig.json"));
                if (model != null)
                {
                    tbUid.Text = model.Uid;
                    tbCookie.Text = model.Cookie;
                }
            }
        }

        private void Theme_Click(object sender, RoutedEventArgs e)
        {
            if (Wpf.Ui.Appearance.ApplicationThemeManager.GetAppTheme() == Wpf.Ui.Appearance.ApplicationTheme.Light)
            {
                themeButton.Icon = new SymbolIcon(SymbolRegular.WeatherSunny48);
                Wpf.Ui.Appearance.ApplicationThemeManager.Apply(Wpf.Ui.Appearance.ApplicationTheme.Dark);
            }
            else
            {
                themeButton.Icon = new SymbolIcon(SymbolRegular.WeatherMoon48);
                Wpf.Ui.Appearance.ApplicationThemeManager.Apply(Wpf.Ui.Appearance.ApplicationTheme.Light);
            }
        }

        private async void Download_Click(object sender, RoutedEventArgs e)
        {
            try
            {
                btnDownload.IsEnabled = false;
                btnParseJson.IsEnabled = false;

                if (string.IsNullOrEmpty(tbUid.Text) || string.IsNullOrEmpty(tbCookie.Text))
                {
                    snackbarService?.Show("提示", $"請輸入uid以及cookie", ControlAppearance.Caution, null, TimeSpan.FromSeconds(3));
                    return;
                }

                var json = JsonConvert.SerializeObject(new AppConfig() { Uid = tbUid.Text, Cookie = tbCookie.Text }, Formatting.Indented);
                File.WriteAllText("AppConfig.json", json);

                var options = new RestClientOptions("https://live.kuaishou.com")
                {
                    Timeout = TimeSpan.FromSeconds(15),
                    UserAgent = "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/127.0.0.0 Safari/537.36",
                };
                var client = new RestClient(options);
                var request = new RestRequest($"/live_api/profile/public?count=9999&pcursor=&principalId={tbUid.Text}&hasMore=true", Method.Get);
                request.AddHeader("host", "live.kuaishou.com");
                request.AddHeader("connection", "keep-alive");
                request.AddHeader("cache-control", "max-age=0");
                request.AddHeader("sec-ch-ua", "\"Not)A;Brand\";v=\"99\", \"Google Chrome\";v=\"127\", \"Chromium\";v=\"127\"");
                request.AddHeader("sec-ch-ua-mobile", "?0");
                request.AddHeader("sec-ch-ua-platform", "\"Windows\"");
                request.AddHeader("upgrade-insecure-requests", "1");
                request.AddHeader("accept", "text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.7");
                request.AddHeader("sec-fetch-site", "none");
                request.AddHeader("sec-fetch-mode", "navigate");
                request.AddHeader("sec-fetch-user", "?1");
                request.AddHeader("sec-fetch-dest", "document");
                request.AddHeader("accept-encoding", "gzip, deflate, br, zstd");
                request.AddHeader("accept-language", "zh,en;q=0.9,zh-CN;q=0.8");
                request.AddHeader("cookie", tbCookie.Text);
                request.AddHeader("x-postman-captr", "9467712");
                RestResponse response = await client.ExecuteAsync(request);
                Debug.WriteLine(response.Content);

                var model = JsonConvert.DeserializeObject(response.Content!);
                if (model == null || model?.Data?.List == null || model?.Data?.List?.Count == 0)
                {
                    snackbarService?.Show("提示", $"獲取失敗,可能觸發(fā)了快手的風控機制,請等一段時間再試。", ControlAppearance.Danger, null, TimeSpan.FromSeconds(3));
                    return;
                }

                await Download(model!);
            }
            finally
            {
                btnDownload.IsEnabled = true;
                btnParseJson.IsEnabled = true;
            }
        }

        private async void ParseJson_Click(object sender, RoutedEventArgs e)
        {
            try
            {
                btnDownload.IsEnabled = false;
                btnParseJson.IsEnabled = false;

                var dialog = new Microsoft.Win32.OpenFileDialog();
                dialog.Filter = "Json文件(.Json)|*.json";
                bool? result = dialog.ShowDialog();
                if (result == false)
                {
                    return;
                }
                var model = JsonConvert.DeserializeObject(File.ReadAllText(dialog.FileName)!);
                if (model == null || model?.Data?.List == null || model?.Data?.List?.Count == 0)
                {
                    snackbarService?.Show("提示", $"不是正確的json", ControlAppearance.Caution, null, TimeSpan.FromSeconds(3));
                    return;
                }

                await Download(model!);
            }
            finally
            {
                btnDownload.IsEnabled = true;
                btnParseJson.IsEnabled = true;
            }
        }

        private async Task Download(KuaishouModel model)
        {
            progress.Value = 0;
            progress.Minimum = 0;
            progress.Maximum = (double)model?.Data?.List?.Count!;
            snackbarService?.Show("提示", $"解析到{model?.Data?.List?.Count!}個作品,開始下載", ControlAppearance.Success, null, TimeSpan.FromSeconds(5));

            imgHeader.Source = new System.Windows.Media.Imaging.BitmapImage(new Uri(model?.Data?.List?[0]?.Author?.Avatar!));
            tbNickName.Text = model?.Data?.List?[0]?.Author?.Name;

            string pattern = @"\d{4}/\d{2}/\d{2}/\d{2}";

            for (int i = 0; i < model?.Data?.List!.Count; i++)
            {
                DateTime dateTime = DateTime.Now;
                string fileNamePrefix = "";
                var item = model?.Data?.List[i]!;
                Match match = Regex.Match(item.Poster!, pattern);
                if (match.Success)
                {
                    dateTime = new DateTime(int.Parse(match.Value.Split("/")[0]), int.Parse(match.Value.Split("/")[1]),
                        int.Parse(match.Value.Split("/")[2]), int.Parse(match.Value.Split("/")[3]), 0, 0);
                    if (cbAddDate.IsChecked == true)
                        fileNamePrefix = match.Value.Split("/")[0] + "-" + match.Value.Split("/")[1] + "-" + match.Value.Split("/")[2]
                            + " " + match.Value.Split("/")[3] + "-00-00 ";
                }
                downloadFolder = Path.Combine(AppContext.BaseDirectory, "Download", item?.Author?.Name! + "(" + item?.Author?.Id! + ")");
                Directory.CreateDirectory(downloadFolder);

                switch (item?.WorkType)
                {
                    case "single":
                    case "vertical":
                    case "multiple":
                        {
                            await DownLoadHelper.Download(item?.ImgUrls!, dateTime, downloadFolder, fileNamePrefix);
                        }
                        break;
                    case "video":
                        {
                            await DownLoadHelper.Download(new List() { item?.PlayUrl! }, dateTime, downloadFolder, fileNamePrefix);
                        }
                        break;
                }

                progress.Value = i + 1;
                tbProgress.Text = $"{i + 1} / {model?.Data?.List!.Count}";
                Random random = new Random();
                if (cbLongInterval.IsChecked == true)
                    await Task.Delay(random.Next(5000, 10000));
                else
                    await Task.Delay(random.Next(1000, 5000));
            }

            snackbarService?.Show("提示", $"下載完成,共下載{model?.Data?.List!.Count}個作品", ControlAppearance.Success, null, TimeSpan.FromDays(1));
        }

        private void CopyUrl(object sender, System.Windows.Input.MouseButtonEventArgs e)
        {
            if (string.IsNullOrEmpty(tbUid.Text))
            {
                snackbarService?.Show("提示", "請輸入uid以及cookie", ControlAppearance.Caution, null, TimeSpan.FromSeconds(3));
                return;
            }
            Clipboard.SetText($"https://live.kuaishou.com/live_api/profile/public?count=9999&pcursor=&principalId={tbUid.Text}&hasMore=true");

            snackbarService?.Show("提示", "復制完成,請粘貼到瀏覽器打開", ControlAppearance.Success, null, TimeSpan.FromSeconds(3));
        }

        private void Info_Click(object sender, RoutedEventArgs e)
        {
            flyout.IsOpen = true;
        }
    }
}
  1. 下載類,下載完文件后,將文件的日志修改為發(fā)表日志,方便排序以及數(shù)據(jù)分析。
點擊查看代碼
public static async Task Download(List urls, DateTime dateTime, string downloadFolder, string fileNamePrefix)
{
    string file = string.Empty;
    try
    {
        var downloader = new DownloadService();
        foreach (var url in urls)
        {
            Uri uri = new Uri(url);
            file = downloadFolder + "\\" + fileNamePrefix + Path.GetFileName(uri.LocalPath);
            if (!File.Exists(file))
                await downloader.DownloadFileTaskAsync(url, file);

            //修改文件日期時間為發(fā)博的時間
            File.SetCreationTime(file, dateTime);
            File.SetLastWriteTime(file, dateTime);
            File.SetLastAccessTime(file, dateTime);
        }
    }
    catch
    {
        Debug.WriteLine(file);
        Trace.Listeners.Add(new TextWriterTraceListener(downloadFolder + "\\_FailedFiles.txt", "myListener"));
        Trace.TraceInformation(file);
        Trace.Flush();
    }
}
  1. 源碼分享
    完整版代碼已上傳到Github https://github.com/hupo376787/KuaishouDownloader ,喜歡的點一下Star謝謝。

4. 下載使用

打開 https://github.com/hupo376787/KuaishouDownloader/releases/tag/1.0 ,點擊下載zip文件,解壓縮后,就可以像開頭那樣使用了。
使用C#爬取快手作者主頁,并下載視頻/圖集(附源碼及軟件下載鏈接)
使用C#爬取快手作者主頁,并下載視頻/圖集(附源碼及軟件下載鏈接)

小編推薦閱讀

好特網(wǎng)發(fā)布此文僅為傳遞信息,不代表好特網(wǎng)認同期限觀點或證實其描述。

爬 1.0
爬 1.0
類型:休閑益智  運營狀態(tài):正式運營  語言:中文   

游戲攻略

游戲禮包

游戲視頻

游戲下載

游戲活動

《爬》是SYPLAYER工作室開發(fā)的一款非常不錯的水墨風格爬塔系列游戲,游戲中玩家能體驗到久違的休閑爬塔冒
鏈接 1.0
鏈接 1.0
類型:休閑益智  運營狀態(tài):正式運營  語言: 英文   

游戲攻略

游戲禮包

游戲視頻

游戲下載

游戲活動

《鏈接》是游戲商KishorBerde開發(fā)的一款趣味的益智類休閑游戲。游戲的玩法非常簡單,玩家需要將相同顏色

相關視頻攻略

更多

掃二維碼進入好特網(wǎng)手機版本!

掃二維碼進入好特網(wǎng)微信公眾號!

本站所有軟件,都由網(wǎng)友上傳,如有侵犯你的版權(quán),請發(fā)郵件[email protected]

湘ICP備2022002427號-10 湘公網(wǎng)安備:43070202000427號© 2013~2025 haote.com 好特網(wǎng)