精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

使用AWS云端機器學習,構建無服務器新聞數據管道

譯文
人工智能 機器學習
本文介紹了如何使用作為Sagemaker端點來部署的機器學習模型在AWS上構建無服務器數據管道。

[[436699]]

【51CTO.com快譯】作為一名分析師,我花很多時間來跟蹤新聞和行業最新資訊。我在休產假時考慮了這個問題,決定構建一個簡單的應用程序來跟蹤有關綠色技術和可再生能源的新聞。使用AWS Lambda及AWS的其他服務(比如EventBridge、SNS、DynamoDB和Sagemaker),可以非常輕松地上手,在幾天內構建好原型。

該應用程序由一系列無服務器Lambda函數和作為SageMaker端點來部署的文本摘要機器學習模型提供支持。AWS EventBridge規則每24小時觸發一次Lambda函數,從DynamoDB數據庫獲取新聞源(feed)。

然后這些新聞源作為SNS主題來發送,以觸發多個Lambda分析新聞源并提取新聞URL。每個網站每天更新RSS新聞源最多只更新幾篇文章,因此我們不會發送大批流量,不然可能會導致消耗任何特定新聞出版物的過多資源。

然而,一大問題是提取文章的全文,因為每個網站不一樣。對我們來說幸運的是,goose3之類的庫通過運用機器學習方法提取頁面正文來解決這個問題。由于版權問題,我無法存儲文章的全文,這就是為什么我運用HuggingFace文本摘要轉換器模型來生成簡短摘要。

下面詳細介紹了如何自行構建基于機器學習的新聞聚合管道。

1. 設置擁有必要權限的IAM角色。

雖然這個數據管道很簡單,但它連接許多AWS資源。想授予我們的函數訪問所有所需資源的權限,我們需要設置IAM角色。該角色為函數賦予了使用云端其他資源的權限,比如DynamoDB、Sagemaker、CloudWatch和SNS。出于安全原因,最好不要為我們的IAM角色賦予全面的AWS管理訪問權限,只允許它使用所需的資源。

2. 在RSS Dispatcher Lambda中從DynamoDB獲取RSS新聞源

使用AWS Lambda幾乎可以做任何事情,它是一種非常強大的無服務器計算服務,非常適合短任務。對我而言,主要優點在于很容易訪問AWS生態系統中的其他服務。

我將所有RSS新聞源存儲在DynamoDB表中,使用boto3庫從Lambda訪問它真的很容易。一旦從數據庫獲取所有新聞源后,我將它們作為SNS消息發送,以觸發新聞源解析Lambda。

  1. import boto3 
  2. import json 
  3. def lambda_handler(event, context): 
  4.     # Connect to DynamoDB 
  5.     dynamodb = boto3.resource('dynamodb'
  6.      
  7.     # Get table 
  8.     table = dynamodb.Table('rss_feeds'
  9.      
  10.     # Get all records from the table 
  11.     data = table.scan()['Items'
  12.     rss = [y['rss'for y in data] 
  13.      
  14.     # Connect to SNS 
  15.     client = boto3.client('sns'
  16.      
  17.     # Send messages to the queue 
  18.     for item in rss: 
  19.         client.publish(TopicArn="arn:aws:sns:eu-west-1:802099603194:rss_to-parse",  Message = item) 

3. 使用必要的庫創建層

想在AWS Lambdas中使用一些特定庫,您需要將它們作為層來導入。想準備庫導入,它需要位于python.zip壓縮包中,然后我們可以將其上傳到AWS并在函數中使用。想創建層,只需cd進入到Python文件夾中,運行pip install命令,將其壓縮并準備好上傳。

  1. pip install feedparser -t 

然而,我將goose3庫作為一個層來部署時遇到了一些困難。簡單的調查后發現,LXML等一些庫需要在類似Lambda的環境(Linux)中加以編譯。因此如果庫在Windows上編譯,然后導入到函數中,就會發生錯誤。為了解決這個問題,在創建壓縮包之前,我們需要在Linux上安裝該庫。

這有兩種方法。首先,安裝在帶有Docker的模擬Lambda環境上。對我來說,最簡單的方法是使用AWS sam build命令。函數構建后,我只需從構建文件夾中拷貝所需的包,并將它們作為層來上傳。

  1. sam build --use-container 

4. 啟動Lambda函數來解析新聞源

一旦我們將新聞URL作為主題發送到SNS,就可以觸發多個Lambda從RSS新聞源去獲取新聞文章。一些RSS新聞源不一樣,但新聞源解析器庫允許我們使用不同的格式。我們的URL是事件對象的一部分,所以我們需要通過key來提取它。

  1. import boto3 
  2. import feedparser 
  3. from datetime import datetime 
  4. def lambda_handler(event, context): 
  5.     
  6.     #Connect to DynamoDB 
  7.     dynamodb = boto3.resource('dynamodb'
  8.     # Get table 
  9.     table = dynamodb.Table('news'
  10.      
  11.     # Get a url from from event 
  12.     url = event['Records'][0]['Sns']['Message'
  13.     
  14.     # Parse the rss feed 
  15.     feed = feedparser.parse(url) 
  16.      
  17.     for item in feed['entries']: 
  18.         result = { 
  19.             "news_url": item['link'], 
  20.             "title": item['title'], 
  21.             "created_at": datetime.now().strftime('%Y-%m-%d') # so that dynamodb will be ok with our date 
  22.         } 
  23.          
  24.         # Save the result to dynamodb 
  25.         table.put_item(Item=result, ConditionExpression='attribute_not_exists(news_url)') # store only unique urls 

5. 在Sagemaker上創建和部署文本摘要模型

Sagemaker是一項服務,可讓您輕松在AWS上編寫、訓練和部署機器學習模型。 HuggingFace與AWS合作,使用戶更容易將其模型部署到云端。

這里我在Jupiter notebook中編寫了一個簡單的文本摘要模型,并使用deploy()命令來部署它。

  1. from sagemaker.huggingface import HuggingFaceModel 
  2. import sagemaker 
  3. role = sagemaker.get_execution_role() 
  4. hub = { 
  5.     'HF_MODEL_ID':'facebook/bart-large-cnn'
  6.      'HF_TASK':'summarization' 
  7. # Hugging Face Model Class 
  8. huggingface_model = HuggingFaceModel( 
  9.     transformers_version='4.6.1'
  10.     pytorch_version='1.7.1'
  11.     py_version='py36'
  12.     env=hub, 
  13.     role=role,  
  14. # deploy model to SageMaker Inference 
  15. predictor = huggingface_model.deploy( 
  16.     initial_instance_count=1, # number of instances 
  17.     instance_type='ml.m5.xlarge' # ec2 instance type 

一旦部署完畢,我們可以從Sagemaker -> Inference -> Endpoint configuration獲取端點信息,并用在我們的Lamdas中。

6. 獲取文章的全文、摘要文章并將結果存儲在DynamoDB中

由于版權我們不會存儲全文,這就是為什么所有處理工作都在一個Lambda中進行。一旦URL進入到Dynamo DB表,我啟動了文本處理Lambda。為此,我創建了DynamoDB項生成,作為啟動Lambda的觸發器。我創建了批大小,那樣Lambda每次只處理一篇文章。

  1. import json 
  2. import boto3  
  3. from goose3 import Goose 
  4. from datetime import datetime 
  5. def lambda_handler(event, context): 
  6.     # Get url from DynamoDB record creation event 
  7.     url =  event['Records'][0]['dynamodb']['Keys']['news_url']['S'
  8.      
  9.     # fetch article full text 
  10.     g = Goose() 
  11.     article = g.extract(url=url) 
  12.      
  13.     body = article.cleaned_text # clean article text 
  14.      
  15.     published_date = article.publish_date # from meta desc 
  16.      
  17.     # Create a summary using our HuggingFace text summary model 
  18.     ENDPOINT_NAME = "your_model_endpoint" 
  19.     runtime= boto3.client('runtime.sagemaker'
  20.      
  21.     response = runtime.invoke_endpoint(EndpointName=ENDPOINT_NAME, ContentType='application/json', Body=json.dumps(data)) 
  22.     
  23.     #extract a summary 
  24.     summary = json.loads(response['Body'].read().decode()) 
  25.      
  26.     #Connect to DynamoDB 
  27.     dynamodb = boto3.resource('dynamodb'
  28.     # Get table 
  29.     table = dynamodb.Table('news'
  30.      
  31.     # Update item stored in dynamoDB 
  32.     update = table.update_item( 
  33.         Key = { "news_url": url  } 
  34.         , 
  35.         ConditionExpression= 'attribute_exists(news_url) ',  
  36.         UpdateExpression='SET summary = :val1, published_date = :val2' 
  37.         ExpressionAttributeValues={ 
  38.             ':val1': summary, 
  39.             ':val2': published_date 
  40.         } 
  41.     ) 

這就是我們如何使用AWS工具,構建并部署一個簡單的無服務器數據管道以讀取最新新聞的過程。

原文標題:Build a Serverless News Data Pipeline using ML on AWS Cloud,作者:Maria Zentsova

【51CTO譯稿,合作站點轉載請注明原文譯者和出處為51CTO.com】

 

責任編輯:華軒 來源: 51CTO
相關推薦

2018-11-28 09:28:28

無服務器架構網絡服務

2016-11-30 10:33:33

云計算AWS

2021-01-20 15:46:11

機器學習人工智能無服務

2018-10-24 12:15:06

無服務器軟件方式

2025-02-14 15:36:05

2015-08-11 09:48:53

2022-10-09 08:08:02

人工智能機器學習平臺

2024-01-02 09:00:00

無服務器架構RASP

2017-08-23 10:28:01

AWS云安全服務

2018-11-02 09:00:15

云端無服務器虛擬機

2022-12-13 10:45:12

無服務器架構物聯網工具

2022-04-25 15:05:33

機器學習人工智能數據集

2019-04-30 10:27:46

無服務器云計算安全

2020-02-19 10:39:44

機器學習云計算數據

2018-10-10 19:39:37

云計算云服務Kubernetes

2018-02-24 10:15:36

無服務器容器云計算

2023-08-29 15:07:35

無服務器計算云計算

2013-08-14 09:30:50

云端裸機服務器

2022-04-08 18:51:43

惡意軟件加密網絡攻擊

2017-06-05 10:08:33

無服務器計算AWS Lambda
點贊
收藏

51CTO技術棧公眾號

国产伦精品一区二区三区| 国产丝袜一区视频在线观看| 视频一区二区视频| www.综合色| 成码无人av片在线观看网站| 国产一区二区免费看| 久久久久久久成人| 91久久免费视频| 国产欧美视频在线| 欧美午夜精品久久久久久人妖| 亚洲精品欧美精品| 欧美少妇bbw| 日韩国产成人精品| 色综合91久久精品中文字幕| 少妇毛片一区二区三区| 91精品网站在线观看| 性欧美大战久久久久久久久| 日韩妆和欧美的一区二区| 99久久国产免费| 日韩av一级电影| 国内精品久久久久久久久| 99久久99久久精品免费看小说. | 欧美1级片网站| 日韩av有码在线| 国产又粗又猛又爽又黄| 国产在线|日韩| 天天操天天干天天综合网| 亚洲美女自拍偷拍| 91精品国产综合久久久久久豆腐| 99视频国产精品| 川上优av一区二区线观看| 日韩精品成人免费观看视频| 国产综合自拍| 久久精品99国产精品酒店日本| 91网站免费入口| 欧美三级电影在线| 亚洲成人av片在线观看| 91亚洲一区二区| 成人在线免费公开观看视频| 国产99久久久久| 国产日韩欧美在线| 中文字幕av影视| 久久国产日本精品| 国内精品一区二区三区| 黄网站免费在线| 欧美伊人影院| 欧美大片一区二区| 加勒比av中文字幕| 一区二区三区| 91精品麻豆日日躁夜夜躁| 亚洲精品自拍网| 国产精品亚洲成在人线| 欧美丝袜丝交足nylons图片| 韩国中文字幕av| 成人影院在线免费观看| 在线免费观看成人短视频| 国产精品亚洲二区在线观看| 小视频免费在线观看| 黑人巨大精品欧美一区二区一视频| 欧美精品一区二区三区三州| av中文在线资源库| 精品免费在线视频| 黄色高清无遮挡| 成人网ww555视频免费看| 欧美性大战久久| 91视频这里只有精品| 日韩三级成人| 日韩视频免费观看高清在线视频| 国产一级二级av| 国产成人一二片| 色婷婷国产精品久久包臀| 国产精品免费观看久久| 日韩欧美一区二区三区免费观看| 在线观看亚洲精品视频| 激情黄色小视频| 麻豆国产一区二区三区四区| 精品国产乱码久久久久久浪潮| 在线免费看黄色片| 九九视频精品全部免费播放| 一本久久综合亚洲鲁鲁| 老司机成人免费视频| 国产精品vip| 欧美亚洲国产视频小说| 中文字幕在线观看视频一区| 国产激情一区二区三区桃花岛亚洲| 国产精品久久久久久久久久久久午夜片 | 三级在线免费观看| av软件在线观看| 亚洲高清在线视频| 99视频在线免费| 免费一区二区三区在线视频| 亚洲精品第一国产综合精品| 国产18无套直看片| 偷拍欧美精品| 8090成年在线看片午夜| 在线免费观看一区二区| 成人黄色综合网站| 日本精品一区二区三区高清 久久| 男人的天堂在线视频免费观看| 一区二区三区欧美亚洲| 色欲av无码一区二区人妻| 四虎永久精品在线| 国产视频亚洲精品| 欧美人妻精品一区二区免费看| 午夜亚洲一区| 91成人免费观看| 国产人成在线视频| 亚洲不卡av一区二区三区| 蜜臀av免费观看| 日韩av影院| 欧美激情第6页| 91麻豆视频在线观看| 久久一区二区三区四区| 国产精品久久久久久久久电影网| 日韩在线观看不卡| 日韩国产精品视频| 加勒比婷婷色综合久久| 免费在线观看精品| 快播亚洲色图| 亚洲AV午夜精品| 国产欧美精品一区二区三区四区 | 欧美日韩一区综合| 黄页网站在线观看免费| 欧美精品日韩一区| 欧洲女同同性吃奶| 亚洲精品美女| http;//www.99re视频| 一区二区高清不卡| 成人午夜免费电影| 杨幂一区欧美专区| 欧美日韩精品免费观看视完整| 欧美高清视频一二三区| 乐播av一区二区三区| 欧美在线免费一级片| 成人免费黄色网| 91社区在线高清| 色哟哟欧美精品| 黄色在线观看av| 国产精品久久777777毛茸茸| 国产乱码精品一区二区三区日韩精品| 麻豆影视国产在线观看| 欧美日本在线观看| 欧美巨胸大乳hitomi| 奇米色一区二区| 欧美一区国产一区| 国模视频一区| 一区二区三区美女xx视频| 欧美男人亚洲天堂| 国产香蕉久久精品综合网| 国产精品亚洲a| 九九久久婷婷| 国产精品wwww| 一级日本在线| 日韩一级欧美一级| 欧美精品成人久久| 成人免费毛片app| 免费看国产曰批40分钟| 色狼人综合干| 国产精品av电影| 色影视在线观看| 91精品免费在线| 久久一级黄色片| 99久久国产综合精品麻豆 | 久久精品国产第一区二区三区| 一区二区不卡在线| 国产亚洲高清在线观看| 欧美极品美女视频网站在线观看免费| 丰满人妻一区二区三区免费视频 | 美女少妇精品视频| 亚洲爱情岛论坛永久| 亚洲成在人线在线播放| 国产呦小j女精品视频| 日韩成人一级片| 26uuu成人| 超碰成人97| 欧洲一区二区视频| 97在线观看免费观看高清| 欧美精品v国产精品v日韩精品 | 成人亚洲综合天堂| 欧美一区二区高清| 99精品视频99| 欧美国产精品专区| aaaaa黄色片| 免费看黄裸体一级大秀欧美| 中文字幕一区二区三区在线乱码| 日韩成人在线看| 91sao在线观看国产| 日本中文在线观看| 亚洲精品久久在线| 97精品人妻一区二区三区| 亚洲成人av电影在线| 欧美自拍偷拍网| 成人免费高清视频在线观看| 91香蕉视频污版| 在线观看的日韩av| 亚洲视频sss| 日韩超碰人人爽人人做人人添| 国产精品永久免费观看| free性m.freesex欧美| 日韩一中文字幕| 五月婷中文字幕| 日韩一区二区三区高清免费看看| 少妇太紧太爽又黄又硬又爽| 樱桃国产成人精品视频| 性欧美精品男男| 播五月开心婷婷综合| 亚洲精品永久视频| 老牛影视一区二区三区| 欧美久久在线观看| 亚洲天堂免费| 色播亚洲视频在线观看| 欧美男男freegayvideosroom| 91麻豆国产精品| 久久久人成影片一区二区三区在哪下载| 欧美另类精品xxxx孕妇| 天堂地址在线www| 亚洲欧美日韩另类| 香港三日本三级少妇66| 日韩美女一区二区三区四区| 一二三四区在线| 色系网站成人免费| 国产性xxxx高清| 夜夜嗨av一区二区三区网页| 手机免费观看av| 久久影院视频免费| 你懂得在线视频| 国产iv一区二区三区| 激情在线观看视频| 蜜臀国产一区二区三区在线播放| 久久久久久久久久久久久久国产| 亚洲国产91| 成人在线免费高清视频| 2023国产精品久久久精品双| 国产精品偷伦一区二区| 97超碰在线免费| 欧美日韩第一页| 成人国产免费电影| 久久精品国产亚洲一区二区| 在线免费av网站| 在线视频欧美日韩| 天堂а√在线资源在线| www.日韩av.com| 日本电影在线观看网站| 在线亚洲欧美视频| 永久免费在线观看视频| 日韩在线一区二区三区免费视频| 777电影在线观看| 尤物99国产成人精品视频| av在线资源网| 日日骚av一区| a毛片在线观看| 欧美激情二区三区| 国模精品视频| 日本精品一区二区三区在线| 日韩毛片免费观看| 国产精品亚洲视频在线观看 | 国产传媒一区二区| 国产精品久久久网站| 久久久久免费网| 精品视频网站| 正在播放亚洲| 国产精品www994| 阿v天堂2017| 日韩一区精品视频| 国产性生活一级片| 成人污污视频在线观看| 9.1成人看片免费版| 欧美国产成人在线| 成年人一级黄色片| 午夜视频一区二区| 成人免费毛片视频| 在线电影一区二区三区| 高潮一区二区三区乱码| 亚洲女同性videos| 超碰在线观看免费版| 97av在线影院| 欧美系列精品| 国产乱码精品一区二区三区中文| 九九综合九九| 400部精品国偷自产在线观看 | 一区二区三区在线视频免费| 久久夜色精品亚洲| 欧美色精品在线视频| 成人av无码一区二区三区| 亚洲精品天天看| 黄视频在线观看网站| 69av在线视频| 日韩色性视频| 久久这里精品国产99丫e6| 四季av一区二区凹凸精品| 91成人在线观看喷潮教学| 精品一区二区三区在线观看国产 | 全球av集中精品导航福利| 亚洲高清精品中出| 亚洲欧洲综合| 亚洲一二三不卡| 久久精品人人爽人人爽| 欧美黄片一区二区三区| 欧美午夜宅男影院| 天天操天天干天天| 伦伦影院午夜日韩欧美限制| 手机看片久久| 国产精品免费一区二区三区在线观看 | 日韩中文一区二区| 日本一区视频在线观看| 在线精品福利| 日本一二三四区视频| 国产日产亚洲精品系列| 亚洲精品视频在线观看免费视频| 4438x成人网最大色成网站| 久久米奇亚洲| 欧美亚洲国产视频小说| 91蝌蚪精品视频| 在线无限看免费粉色视频| 日韩成人一区二区| 四虎永久免费影院| 精品福利在线视频| 超碰在线播放97| 久久精品国产综合| 黄色精品视频| 欧美精品二区三区四区免费看视频 | 伊人久久久久久久久久| 亚洲天堂电影| 国产一区二区三区四区hd| 中文字幕一区二区三区久久网站| 亚欧在线免费观看| 久久亚洲私人国产精品va媚药| 精品一区在线视频| 欧美大片日本大片免费观看| 国产在线观看a| 91精品综合久久久久久五月天| 欧美精品色图| 美女网站免费观看视频| 久久久久国产精品麻豆| www.com国产| 亚洲男女自偷自拍图片另类| 亚洲优女在线| 久久综合狠狠综合久久综青草| 在线欧美福利| 伊人网综合视频| 亚洲 欧美综合在线网络| 理论片中文字幕| 久久久久中文字幕| 韩国女主播一区二区三区| 99久久国产综合精品五月天喷水| 福利电影一区二区| 久久伊人成人网| 亚洲精品美女在线观看| 超级碰碰久久| 特级西西444www大精品视频| 蜜桃视频一区二区三区在线观看| 国产三级短视频| 欧美精品乱人伦久久久久久| 黄黄的网站在线观看| 99re6热在线精品视频播放速度| 欧美日韩国产探花| 日本五十肥熟交尾| 欧美日韩裸体免费视频| 黄色大片在线看| 国产精品永久免费在线| 亚洲欧美综合久久久| 蜜桃视频无码区在线观看| 亚洲韩国精品一区| 精品视频二区| 国产免费一区视频观看免费| 亚洲精品网址| 久久性爱视频网站| 色婷婷国产精品| 国产精品实拍| 精品国产免费一区二区三区| 久久精品网址| 亚洲波多野结衣| 精品毛片乱码1区2区3区| 在线黄色的网站| 中文字幕中文字幕在线中一区高清 | 欧美成人tv| 亚洲成年人在线观看| 日韩欧美在线视频| 天天影视久久综合| 韩国一区二区三区美女美女秀 | 婷婷夜色潮精品综合在线| 黄色av网站在线看| 91在线高清免费观看| 国产免费成人| 亚洲区一区二区三| 日韩av在线最新| 欧美xxxx性| 日韩免费视频播放| 综合婷婷亚洲小说| 五月婷在线视频| 成人免费在线视频网站| 国产精品日韩久久久| 欧美手机在线观看| 精品亚洲一区二区三区四区五区| 欧美网站免费| 99精品视频在线看| 亚洲一区二区三区国产| 91精彩视频在线观看| 精品视频一区二区三区四区| 国内精品久久久久影院色|