Python 获取股票数据的最佳方式是什么
在本文中,我们将学习使用Python获取股票数据的最佳方式。
我们将使用yfinance Python库从Yahoo Finance获取当前和历史股票市场价格数据。
安装Yahoo Finance(yfinance)
获取股票市场数据的最佳平台之一是Yahoo Finance。只需从Yahoo Finance网站下载数据集,然后使用yfinance库和Python编程访问即可。
您可以使用pip安装yfinance,只需打开命令提示符并输入以下命令即可:
语法
pip install yfinance
yfinance库最好的地方是,它是免费使用的,并且不需要API密钥。
如何获取股票价格的实时数据
我们需要找到可以用于数据提取的股票代码。在下面的示例中,我们将展示GOOGL的当前市场价格和上一个收市价格。
示例
以下程序使用yfinance模块返回市场价格值、前一收市价格值和代码值。
import yfinance as yf
ticker = yf.Ticker('GOOGL').info
marketPrice = ticker['regularMarketPrice']
previousClosePrice = ticker['regularMarketPreviousClose']
print('Ticker Value: GOOGL')
print('Market Price Value:', marketPrice)
print('Previous Close Price Value:', previousClosePrice)
输出
在执行后,上述程序将生成以下输出:
Ticker Value: GOOGL
Market Price Value: 92.83
Previous Close Price Value: 93.71
获取股票价格的历史数据的方法
通过提供开始日期、结束日期和股票代码,我们可以获取完整的历史价格数据。
示例
以下程序返回开始日期和结束日期之间的股票价格数据。
# importing the yfinance package
import yfinance as yf
# giving the start and end dates
startDate = '2015-03-01'
endDate = '2017-03-01'
# setting the ticker value
ticker = 'GOOGL'
# downloading the data of the ticker value between
# the start and end dates
resultData = yf.download(ticker, startDate, endDate)
# printing the last 5 rows of the data
print(resultData.tail())
输出
执行上述程序后,将会产生以下输出结果 −
[*********************100%***********************] 1 of 1 completed
Open High Low Close Adj Close Volume
Date
2017-02-22 42.400002 42.689499 42.335499 42.568001 42.568001 24488000
2017-02-23 42.554001 42.631001 42.125000 42.549999 42.549999 27734000
2017-02-24 42.382500 42.417999 42.147999 42.390499 42.390499 26924000
2017-02-27 42.247501 42.533501 42.150501 42.483501 42.483501 20206000
2017-02-28 42.367500 42.441502 42.071999 42.246498 42.246498 27662000
上面的示例将检索从 2015-03-01 到2017-03-01的股票价格数据。
如果您想同时从多个代码中提取数据,请使用空格分隔的字符串提供代码。
数据转换分析
日期 是数据集的索引,而不是上述数据集中的列。在对其进行任何数据分析之前,您必须将此索引转换为列。下面是如何做到的−
示例
下面的程序将列名添加到开始日期和结束日期之间的股票数据中−
import yfinance as yf
# giving the start and end dates
startDate = '2015-03-01'
endDate = '2017-03-01'
# setting the ticker value
ticker = 'GOOGL'
# downloading the data of the ticker value between
# the start and end dates
resultData = yf.download(ticker, startDate, endDate)
# Setting date as index
resultData["Date"] = resultData.index
# Giving column names
resultData = resultData[["Date", "Open", "High","Low", "Close", "Adj Close", "Volume"]]
# Resetting the index values
resultData.reset_index(drop=True, inplace=True)
# getting the first 5 rows of the data
print(resultData.head())
输出
执行上述程序后,将生成以下输出结果−
[*********************100%***********************] 1 of 1 completed
Date Open High Low Close Adj Close Volume
0 2015-03-02 28.350000 28.799500 28.157499 28.750999 28.750999 50406000
1 2015-03-03 28.817499 29.042500 28.525000 28.939501 28.939501 50526000
2 2015-03-04 28.848499 29.081499 28.625999 28.916500 28.916500 37964000
3 2015-03-05 28.981001 29.160000 28.911501 29.071501 29.071501 35918000
4 2015-03-06 29.100000 29.139000 28.603001 28.645000 28.645000 37592000
上面转换的数据和我们从Yahoo Finance获取的数据是完全相同的
将获取到的数据存储在CSV文件中
to_csv() 方法可以用于将DataFrame对象导出为CSV文件。以下代码将帮助您将数据导出为CSV文件,因为上述转换的数据已经是Pandas数据框。
# importing yfinance module with an alias name
import yfinance as yf
# giving the start and end dates
startDate = '2015-03-01'
endDate = '2017-03-01'
# setting the ticker value
ticker = 'GOOGL'
# downloading the data of the ticker value between
# the start and end dates
resultData = yf.download(ticker, startDate, endDate)
# printing the last 5 rows of the data
print(resultData.tail())
# exporting/converting the above data to a CSV file
resultData.to_csv("outputGOOGL.csv")
输出
执行以上程序后将生成以下输出结果 –
[*********************100%***********************] 1 of 1 completed
Open High Low Close Adj Close Volume
Date
2017-02-22 42.400002 42.689499 42.335499 42.568001 42.568001 24488000
2017-02-23 42.554001 42.631001 42.125000 42.549999 42.549999 27734000
2017-02-24 42.382500 42.417999 42.147999 42.390499 42.390499 26924000
2017-02-27 42.247501 42.533501 42.150501 42.483501 42.483501 20206000
2017-02-28 42.367500 42.441502 42.071999 42.246498 42.246498 27662000
可视化数据
Python中的 yfinance 模块是设置、收集数据和执行数据分析活动最简单的模块之一。使用诸如Matplotlib、Seaborn或Bokeh的包,您可以可视化结果并获取见解。
您甚至可以使用 PyScript 直接在网页上显示这些可视化。
结论
在本文中,我们学习了如何使用Python yfinance模块获取最佳股票数据。此外,我们还学习了如何获取指定时间段的所有股票数据,如何通过添加自定义指标和列进行数据分析,以及如何将这些数据转化为CSV文件。