Gilead-BioStats · jwildfire · Feb 10, 2022 · Feb 8, 2022 · gwu05 · Feb 10, 2022
diff --git a/DESCRIPTION b/DESCRIPTION
@@ -10,7 +10,8 @@ Encoding: UTF-8
 Imports:
     dplyr,
     lubridate, 
-    magrittr
+    magrittr,
+    broom
 Suggests:
     testthat (>= 3.0.0),
     safetyData,

diff --git a/NAMESPACE b/NAMESPACE
@@ -21,6 +21,7 @@ export(Transform_EventCount)
 export(TreatmentExposure)
 import(dplyr)
 import(lubridate)
+importFrom(broom,augment)
 importFrom(lubridate,is.Date)
 importFrom(lubridate,time_length)
 importFrom(magrittr,"%>%")
@@ -30,6 +31,5 @@ importFrom(stats,offset)
 importFrom(stats,pnorm)
 importFrom(stats,poisson)
 importFrom(stats,quantile)
-importFrom(stats,residuals)
 importFrom(stats,sd)
 importFrom(stats,wilcox.test)
diff --git a/R/Analyze_Poisson.R b/R/Analyze_Poisson.R
@@ -15,12 +15,13 @@
 #' The input data (` dfTransformed`) for the Analyze_Poisson is typically created using \code{\link{Transform_EventCount}} and should be one record per Site with columns for: 
 #' - `SubjectID` - Unique subject ID
 #' - `SiteID` - Site ID
-#' - `Count` - Number of Adverse Events 
-#' - `Exposure` - Number of days of exposure 
+#' - `TotalCount` - Number of Events 
+#' - `TotalExposure` - Number of days of exposure 
 #'
 #' @param dfTransformed data.frame in format produced by \code{\link{Transform_EventCount}}. Must include
 #'
-#' @importFrom stats glm offset poisson residuals pnorm
+#' @importFrom stats glm offset poisson pnorm
+#' @importFrom broom augment
 #' 
 #' @return input data frame with columns added for "Residuals", "PredictedCount" and "PValue"
 #' 
@@ -38,18 +39,22 @@ Analyze_Poisson <- function( dfTransformed ){
         all(c("SiteID", "N", "TotalExposure", "TotalCount", "Rate") %in% names(dfTransformed))    
     )
 
-    dfTransformed$LogExposure <- log( dfTransformed$TotalExposure )
+    dfModel <- dfTransformed %>% mutate(LogExposure = log( .data$TotalExposure) )
 
     cModel <- stats::glm(
         TotalCount ~ stats::offset(LogExposure), family=stats::poisson(link="log"), 
-        data=dfTransformed
+        data=dfModel
     )
 
-    dfAnalyzed <- dfTransformed
-    dfAnalyzed$Residuals <- stats::residuals( cModel )
-    dfAnalyzed$PredictedCount <- exp(dfAnalyzed$LogExposure*cModel$coefficients[2]+cModel$coefficients[1])
-    dfAnalyzed$PValue = stats::pnorm( abs(dfAnalyzed$Residuals) , lower.tail=F ) * 2
-    dfAnalyzed <- dfAnalyzed[order(abs(dfAnalyzed$Residuals) , decreasing=T), ]
+    dfAnalyzed <- broom::augment(cModel, dfModel, type.predict = "response") %>% 
+    rename(
+        Residuals=.data$.resid, 
+        PredictedCount=.data$.fitted,
+    ) %>%
+    mutate(PValue = stats::pnorm( abs(.data$Residuals) , lower.tail=F ) * 2) %>%
+    arrange(.data$Residuals)
+
+    # Note that the PValue calculation is a non-standard approximation and might be more accurately labeled a "standardized estimate" rather than a formal p-value.
 
     return(dfAnalyzed)
 }
diff --git a/man/Analyze_Poisson.Rd b/man/Analyze_Poisson.Rd