]> git.angelumana.com Git - tweet_classification/.git/commitdiff
Update readme.txt
authoribidyouadu <60790401+ibidyouadu@users.noreply.github.com>
Mon, 11 May 2020 19:45:18 +0000 (15:45 -0400)
committerGitHub <noreply@github.com>
Mon, 11 May 2020 19:45:18 +0000 (15:45 -0400)
power_outages/readme.txt

index c8d1ab2a6755029c3eba1e9f722c15b74a632fba..45a587ca97918f21f34dbd6ce61769eeae80ef34 100644 (file)
@@ -1,7 +1,7 @@
-power_outages is the code used to produce outages_daily.csv and outages_daily_normalized.csv from outages_original.xlsx\r
+power_outages.py is the code used to produce outages_daily.csv and outages_daily_normalized.csv from outages_original.xlsx\r
 \r
 There are also some functions to produce metrics and for finding patterns in the data using dynamic time warping and kmeans, mostly copied from some medium article. This was fruitless and can be ignored for the most part.\r
 \r
 It is important to understand the data here: all the numbers in outages_daily.csv and outages_original.xlsx represent customers, which are not necessarily individual people. I tried finding more information about the customers, particularly the square footage of the properties, in order to get a hint of exactly how many people would a given customer consist of. I consulted the original source of the outage data, Florida Division of Emergency Management, but to no avail.\r
 \r
-Similarly, outages_daily_normalized.csv has customers without power normalized by customers in total. The customers in total bit is a little complicated. See the code and comments to see what I mean.
\ No newline at end of file
+Similarly, outages_daily_normalized.csv has customers without power normalized by customers in total. The customers in total bit is a little complicated. See the code and comments to see what I mean.\r