src/Print.py

import pandas as pd
import os


def path(repo_name):
    if not os.path.exists("./results/" + repo_name):
        os.mkdir("./results/" + repo_name)


def printData(repo_name, dataset, variables, methods, newmetric):
    path(repo_name)
    # Fare il set_index dei dataframe causa problemi con la successiva analisi e gioco dei dati...
    # evitare se bisogna utilizzare questi per un analisi o conteggio vedi: methods

    # Printing Dataset
    dataset.set_index(["Filename", "Line number"], inplace=True)
    dataset.sort_index(inplace=True)
    dataset.to_csv("./results/" + repo_name + "/DataSet-commitTable.csv")
    dataset.to_excel("./results/" + repo_name + "/DataSet-commitTable.xlsx")
    # print(dataset[:20])

    # Printing Variables
    variables.set_index(["Filename", "Varname"], inplace=True)
    variables.sort_index(inplace=True)
    variables.to_csv("./results/" + repo_name + "/VariablesTable.csv")
    variables.to_excel("./results/" + repo_name + "/VariablesTable.xlsx")
    # print(variables[:20])

    # Printing Methods
    methods.to_csv("./results/" + repo_name + "/MethodsTable.csv")
    methods.to_excel("./results/" + repo_name + "/MethodsTable.xlsx")
    # print(methods_print[:20])

    # Printing NewMetric
    newmetric.set_index(["Filename", "Time"], inplace=True)
    newmetric.sort_index(inplace=True)
    newmetric.to_csv("./results/" + repo_name + "/NearLine.csv")
    # print in Excel: to handle
    # ValueError: This sheet is too large! Your sheet size is: xx, 6 Max sheet size is: 1048576
    # newmetric.to_excel("./results/" + repo_name + "/NearLine.xlsx")
    # print(dataset[:20])

    # Printing Methods-2
    method_count = methods.value_counts(
        ["MethodName", "Class"])  # Return a Series containing counts of unique rows in the DataFrame.
    # method_count.columns = ["MethodName", "Class", "Count"]       # Rinomina le colonne
    method_count.rename("Count", inplace=True)

    # Creo una Serie che tiene [MethodName, Class, lista CallingClasses]
    classes = pd.Series(data=[[] for ind in range(len(method_count))], index=method_count.index)
    # Salvo in classes la lista di classi che invocano ciascun metodo
    for i in method_count.index:  # per ciascuna coppia (MethodName e Class di appartenenza)
        temp = methods.loc[methods["MethodName"] == i[0]]  # prendo tutte le entry in methods con lo stesso MethodName
        for j in temp.index:  # per ciascuna entry presente in methods con questo MethodName
            if temp.loc[j]["CallingClass"] not in classes[i]:
                classes[i].append(temp.loc[j]["CallingClass"])  # salvo tutte le classi che invocano questo metodo
    classes.rename("CallingClasses", inplace=True)

    # Concat method_count e classes
    method_count = pd.DataFrame(method_count)
    method_count = pd.concat([method_count, classes], axis=1)
    method_count.reset_index(inplace=True)
    # Save
    method_count.to_csv("./results/" + repo_name + "/FinalMethodTable.csv", index=False)
    # method_count.to_excel("./results/" + repo_name + "/FinalMethodTable.xlsx", index=False)

    del dataset
    del variables
    del methods
    del method_count