{
 "cells": [
  {
   "cell_type": "code",
   "execution_count": 3,
   "metadata": {},
   "outputs": [],
   "source": [
    "import warnings\n",
    "warnings.filterwarnings(\"ignore\")\n",
    "\n",
    "from xai_agg import *\n",
    "\n",
    "from sklearn.model_selection import train_test_split\n",
    "from sklearn.metrics import accuracy_score, roc_auc_score\n",
    "from sklearn.ensemble import RandomForestClassifier\n",
    "\n",
    "import pandas as pd"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 4,
   "metadata": {},
   "outputs": [],
   "source": [
    "from IPython.core.display import display, HTML\n",
    "\n",
    "def display_side_by_side(dfs: list[pd.DataFrame], captions: list[str] = []):\n",
    "    \"\"\"Display tables side by side to save vertical space\n",
    "    Input:\n",
    "        dfs: list of pandas.DataFrame\n",
    "        captions: list of table captions\n",
    "    \"\"\"\n",
    "    output = \"\"\n",
    "    for i, df in enumerate(dfs):\n",
    "        caption = captions[i] if i < len(captions) else \"\"\n",
    "        \n",
    "        output += df.style.set_table_attributes(\"style='display:inline'\").set_caption(f\"<strong>{caption}</strong>\")._repr_html_()\n",
    "        output += \"\\xa0\\xa0\\xa0\"\n",
    "    display(HTML(output))"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "# Preprocess the data\n",
    "1. One-hot-encode categorical variables, making sure the one-hot-encoded column names are in the format \"[FEATURE]_[CATEGORY]\"\n",
    "2. Make sure all column names are valid python identifiers"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 5,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/html": [
       "<div>\n",
       "<style scoped>\n",
       "    .dataframe tbody tr th:only-of-type {\n",
       "        vertical-align: middle;\n",
       "    }\n",
       "\n",
       "    .dataframe tbody tr th {\n",
       "        vertical-align: top;\n",
       "    }\n",
       "\n",
       "    .dataframe thead th {\n",
       "        text-align: right;\n",
       "    }\n",
       "</style>\n",
       "<table border=\"1\" class=\"dataframe\">\n",
       "  <thead>\n",
       "    <tr style=\"text-align: right;\">\n",
       "      <th></th>\n",
       "      <th>Unnamed: 0</th>\n",
       "      <th>Age</th>\n",
       "      <th>Sex</th>\n",
       "      <th>Job</th>\n",
       "      <th>Housing</th>\n",
       "      <th>Saving accounts</th>\n",
       "      <th>Checking account</th>\n",
       "      <th>Credit amount</th>\n",
       "      <th>Duration</th>\n",
       "      <th>Purpose</th>\n",
       "      <th>Credit Risk</th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <th>0</th>\n",
       "      <td>0</td>\n",
       "      <td>67</td>\n",
       "      <td>male</td>\n",
       "      <td>2</td>\n",
       "      <td>own</td>\n",
       "      <td>NaN</td>\n",
       "      <td>little</td>\n",
       "      <td>1169</td>\n",
       "      <td>6</td>\n",
       "      <td>radio/TV</td>\n",
       "      <td>1</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>1</th>\n",
       "      <td>1</td>\n",
       "      <td>22</td>\n",
       "      <td>female</td>\n",
       "      <td>2</td>\n",
       "      <td>own</td>\n",
       "      <td>little</td>\n",
       "      <td>moderate</td>\n",
       "      <td>5951</td>\n",
       "      <td>48</td>\n",
       "      <td>radio/TV</td>\n",
       "      <td>2</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>2</th>\n",
       "      <td>2</td>\n",
       "      <td>49</td>\n",
       "      <td>male</td>\n",
       "      <td>1</td>\n",
       "      <td>own</td>\n",
       "      <td>little</td>\n",
       "      <td>NaN</td>\n",
       "      <td>2096</td>\n",
       "      <td>12</td>\n",
       "      <td>education</td>\n",
       "      <td>1</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>3</th>\n",
       "      <td>3</td>\n",
       "      <td>45</td>\n",
       "      <td>male</td>\n",
       "      <td>2</td>\n",
       "      <td>free</td>\n",
       "      <td>little</td>\n",
       "      <td>little</td>\n",
       "      <td>7882</td>\n",
       "      <td>42</td>\n",
       "      <td>furniture/equipment</td>\n",
       "      <td>1</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>4</th>\n",
       "      <td>4</td>\n",
       "      <td>53</td>\n",
       "      <td>male</td>\n",
       "      <td>2</td>\n",
       "      <td>free</td>\n",
       "      <td>little</td>\n",
       "      <td>little</td>\n",
       "      <td>4870</td>\n",
       "      <td>24</td>\n",
       "      <td>car</td>\n",
       "      <td>2</td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>\n",
       "</div>"
      ],
      "text/plain": [
       "   Unnamed: 0  Age     Sex  Job Housing Saving accounts Checking account  \\\n",
       "0           0   67    male    2     own             NaN           little   \n",
       "1           1   22  female    2     own          little         moderate   \n",
       "2           2   49    male    1     own          little              NaN   \n",
       "3           3   45    male    2    free          little           little   \n",
       "4           4   53    male    2    free          little           little   \n",
       "\n",
       "   Credit amount  Duration              Purpose  Credit Risk  \n",
       "0           1169         6             radio/TV            1  \n",
       "1           5951        48             radio/TV            2  \n",
       "2           2096        12            education            1  \n",
       "3           7882        42  furniture/equipment            1  \n",
       "4           4870        24                  car            2  "
      ]
     },
     "metadata": {},
     "output_type": "display_data"
    },
    {
     "data": {
      "text/html": [
       "<div>\n",
       "<style scoped>\n",
       "    .dataframe tbody tr th:only-of-type {\n",
       "        vertical-align: middle;\n",
       "    }\n",
       "\n",
       "    .dataframe tbody tr th {\n",
       "        vertical-align: top;\n",
       "    }\n",
       "\n",
       "    .dataframe thead th {\n",
       "        text-align: right;\n",
       "    }\n",
       "</style>\n",
       "<table border=\"1\" class=\"dataframe\">\n",
       "  <thead>\n",
       "    <tr style=\"text-align: right;\">\n",
       "      <th></th>\n",
       "      <th>Unnamed: 0</th>\n",
       "      <th>Age</th>\n",
       "      <th>Job</th>\n",
       "      <th>Credit amount</th>\n",
       "      <th>Duration</th>\n",
       "      <th>Credit Risk</th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <th>count</th>\n",
       "      <td>954.000000</td>\n",
       "      <td>954.000000</td>\n",
       "      <td>954.000000</td>\n",
       "      <td>954.000000</td>\n",
       "      <td>954.000000</td>\n",
       "      <td>954.000000</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>mean</th>\n",
       "      <td>476.500000</td>\n",
       "      <td>35.501048</td>\n",
       "      <td>1.909853</td>\n",
       "      <td>3279.112159</td>\n",
       "      <td>20.780922</td>\n",
       "      <td>1.302935</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>std</th>\n",
       "      <td>275.540378</td>\n",
       "      <td>11.379668</td>\n",
       "      <td>0.649681</td>\n",
       "      <td>2853.315158</td>\n",
       "      <td>12.046483</td>\n",
       "      <td>0.459768</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>min</th>\n",
       "      <td>0.000000</td>\n",
       "      <td>19.000000</td>\n",
       "      <td>0.000000</td>\n",
       "      <td>250.000000</td>\n",
       "      <td>4.000000</td>\n",
       "      <td>1.000000</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>25%</th>\n",
       "      <td>238.250000</td>\n",
       "      <td>27.000000</td>\n",
       "      <td>2.000000</td>\n",
       "      <td>1360.250000</td>\n",
       "      <td>12.000000</td>\n",
       "      <td>1.000000</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>50%</th>\n",
       "      <td>476.500000</td>\n",
       "      <td>33.000000</td>\n",
       "      <td>2.000000</td>\n",
       "      <td>2302.500000</td>\n",
       "      <td>18.000000</td>\n",
       "      <td>1.000000</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>75%</th>\n",
       "      <td>714.750000</td>\n",
       "      <td>42.000000</td>\n",
       "      <td>2.000000</td>\n",
       "      <td>3975.250000</td>\n",
       "      <td>24.000000</td>\n",
       "      <td>2.000000</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>max</th>\n",
       "      <td>953.000000</td>\n",
       "      <td>75.000000</td>\n",
       "      <td>3.000000</td>\n",
       "      <td>18424.000000</td>\n",
       "      <td>72.000000</td>\n",
       "      <td>2.000000</td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>\n",
       "</div>"
      ],
      "text/plain": [
       "       Unnamed: 0         Age         Job  Credit amount    Duration  \\\n",
       "count  954.000000  954.000000  954.000000     954.000000  954.000000   \n",
       "mean   476.500000   35.501048    1.909853    3279.112159   20.780922   \n",
       "std    275.540378   11.379668    0.649681    2853.315158   12.046483   \n",
       "min      0.000000   19.000000    0.000000     250.000000    4.000000   \n",
       "25%    238.250000   27.000000    2.000000    1360.250000   12.000000   \n",
       "50%    476.500000   33.000000    2.000000    2302.500000   18.000000   \n",
       "75%    714.750000   42.000000    2.000000    3975.250000   24.000000   \n",
       "max    953.000000   75.000000    3.000000   18424.000000   72.000000   \n",
       "\n",
       "       Credit Risk  \n",
       "count   954.000000  \n",
       "mean      1.302935  \n",
       "std       0.459768  \n",
       "min       1.000000  \n",
       "25%       1.000000  \n",
       "50%       1.000000  \n",
       "75%       2.000000  \n",
       "max       2.000000  "
      ]
     },
     "metadata": {},
     "output_type": "display_data"
    },
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "<class 'pandas.core.frame.DataFrame'>\n",
      "RangeIndex: 954 entries, 0 to 953\n",
      "Data columns (total 11 columns):\n",
      " #   Column            Non-Null Count  Dtype \n",
      "---  ------            --------------  ----- \n",
      " 0   Unnamed: 0        954 non-null    int64 \n",
      " 1   Age               954 non-null    int64 \n",
      " 2   Sex               954 non-null    object\n",
      " 3   Job               954 non-null    int64 \n",
      " 4   Housing           954 non-null    object\n",
      " 5   Saving accounts   779 non-null    object\n",
      " 6   Checking account  576 non-null    object\n",
      " 7   Credit amount     954 non-null    int64 \n",
      " 8   Duration          954 non-null    int64 \n",
      " 9   Purpose           954 non-null    object\n",
      " 10  Credit Risk       954 non-null    int64 \n",
      "dtypes: int64(6), object(5)\n",
      "memory usage: 82.1+ KB\n"
     ]
    },
    {
     "data": {
      "text/plain": [
       "None"
      ]
     },
     "metadata": {},
     "output_type": "display_data"
    },
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "Unique values of the categorical features:\n",
      "\t- Sex: ['male' 'female']\n",
      "\t- Housing: ['own' 'free' 'rent']\n",
      "\t- Saving accounts: [nan 'little' 'quite rich' 'rich' 'moderate']\n",
      "\t- Checking account: ['little' 'moderate' nan 'rich']\n",
      "\t- Purpose: ['radio/TV' 'education' 'furniture/equipment' 'car' 'business'\n",
      " 'domestic appliances' 'repairs' 'vacation/others']\n"
     ]
    }
   ],
   "source": [
    "original_data = pd.read_csv('../data/german_credit_data_updated.csv')\n",
    "\n",
    "# Dataset overview - German Credit Risk (from Kaggle):\n",
    "# 1. Age (numeric)\n",
    "# 2. Sex (text: male, female)\n",
    "# 3. Job (numeric: 0 - unskilled and non-resident, 1 - unskilled and resident, 2 - skilled, 3 - highly skilled)\n",
    "# 4. Housing (text: own, rent, or free)\n",
    "# 5. Saving accounts (text - little, moderate, quite rich, rich)\n",
    "# 6. Checking account (numeric, in DM - Deutsch Mark)\n",
    "# 7. Credit amount (numeric, in DM)\n",
    "# 8. Duration (numeric, in month)\n",
    "# 9. Purpose (text: car, furniture/equipment, radio/TV, domestic appliances, repairs, education, business, vacation/others)\n",
    "\n",
    "display(original_data.head())\n",
    "display(original_data.describe())\n",
    "display(original_data.info())\n",
    "\n",
    "# Display the unique values of the categorical features:\n",
    "print('Unique values of the categorical features:')\n",
    "for col in original_data.select_dtypes(include='object'):\n",
    "    print(f'\\t- {col}: {original_data[col].unique()}')"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 6,
   "metadata": {},
   "outputs": [
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "Categorical features: Index(['Sex', 'Job', 'Housing', 'Saving accounts', 'Checking account',\n",
      "       'Purpose'],\n",
      "      dtype='object')\n",
      "Numerical features: Index(['Age', 'Credit amount', 'Duration'], dtype='object')\n"
     ]
    },
    {
     "data": {
      "text/html": [
       "<div>\n",
       "<style scoped>\n",
       "    .dataframe tbody tr th:only-of-type {\n",
       "        vertical-align: middle;\n",
       "    }\n",
       "\n",
       "    .dataframe tbody tr th {\n",
       "        vertical-align: top;\n",
       "    }\n",
       "\n",
       "    .dataframe thead th {\n",
       "        text-align: right;\n",
       "    }\n",
       "</style>\n",
       "<table border=\"1\" class=\"dataframe\">\n",
       "  <thead>\n",
       "    <tr style=\"text-align: right;\">\n",
       "      <th></th>\n",
       "      <th>Age</th>\n",
       "      <th>Credit_amount</th>\n",
       "      <th>Duration</th>\n",
       "      <th>Credit_Risk</th>\n",
       "      <th>Sex_female</th>\n",
       "      <th>Sex_male</th>\n",
       "      <th>Job_highlyskilled</th>\n",
       "      <th>Job_skilled</th>\n",
       "      <th>Job_unskilled_nonresident</th>\n",
       "      <th>Job_unskilled_resident</th>\n",
       "      <th>...</th>\n",
       "      <th>Checking_account_none</th>\n",
       "      <th>Checking_account_rich</th>\n",
       "      <th>Purpose_business</th>\n",
       "      <th>Purpose_car</th>\n",
       "      <th>Purpose_domestic_appliances</th>\n",
       "      <th>Purpose_education</th>\n",
       "      <th>Purpose_furniture_equipment</th>\n",
       "      <th>Purpose_radio_TV</th>\n",
       "      <th>Purpose_repairs</th>\n",
       "      <th>Purpose_vacation_others</th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <th>0</th>\n",
       "      <td>67</td>\n",
       "      <td>1169</td>\n",
       "      <td>6</td>\n",
       "      <td>0</td>\n",
       "      <td>0</td>\n",
       "      <td>1</td>\n",
       "      <td>0</td>\n",
       "      <td>1</td>\n",
       "      <td>0</td>\n",
       "      <td>0</td>\n",
       "      <td>...</td>\n",
       "      <td>0</td>\n",
       "      <td>0</td>\n",
       "      <td>0</td>\n",
       "      <td>0</td>\n",
       "      <td>0</td>\n",
       "      <td>0</td>\n",
       "      <td>0</td>\n",
       "      <td>1</td>\n",
       "      <td>0</td>\n",
       "      <td>0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>1</th>\n",
       "      <td>22</td>\n",
       "      <td>5951</td>\n",
       "      <td>48</td>\n",
       "      <td>1</td>\n",
       "      <td>1</td>\n",
       "      <td>0</td>\n",
       "      <td>0</td>\n",
       "      <td>1</td>\n",
       "      <td>0</td>\n",
       "      <td>0</td>\n",
       "      <td>...</td>\n",
       "      <td>0</td>\n",
       "      <td>0</td>\n",
       "      <td>0</td>\n",
       "      <td>0</td>\n",
       "      <td>0</td>\n",
       "      <td>0</td>\n",
       "      <td>0</td>\n",
       "      <td>1</td>\n",
       "      <td>0</td>\n",
       "      <td>0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>2</th>\n",
       "      <td>49</td>\n",
       "      <td>2096</td>\n",
       "      <td>12</td>\n",
       "      <td>0</td>\n",
       "      <td>0</td>\n",
       "      <td>1</td>\n",
       "      <td>0</td>\n",
       "      <td>0</td>\n",
       "      <td>0</td>\n",
       "      <td>1</td>\n",
       "      <td>...</td>\n",
       "      <td>1</td>\n",
       "      <td>0</td>\n",
       "      <td>0</td>\n",
       "      <td>0</td>\n",
       "      <td>0</td>\n",
       "      <td>1</td>\n",
       "      <td>0</td>\n",
       "      <td>0</td>\n",
       "      <td>0</td>\n",
       "      <td>0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>3</th>\n",
       "      <td>45</td>\n",
       "      <td>7882</td>\n",
       "      <td>42</td>\n",
       "      <td>0</td>\n",
       "      <td>0</td>\n",
       "      <td>1</td>\n",
       "      <td>0</td>\n",
       "      <td>1</td>\n",
       "      <td>0</td>\n",
       "      <td>0</td>\n",
       "      <td>...</td>\n",
       "      <td>0</td>\n",
       "      <td>0</td>\n",
       "      <td>0</td>\n",
       "      <td>0</td>\n",
       "      <td>0</td>\n",
       "      <td>0</td>\n",
       "      <td>1</td>\n",
       "      <td>0</td>\n",
       "      <td>0</td>\n",
       "      <td>0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>4</th>\n",
       "      <td>53</td>\n",
       "      <td>4870</td>\n",
       "      <td>24</td>\n",
       "      <td>1</td>\n",
       "      <td>0</td>\n",
       "      <td>1</td>\n",
       "      <td>0</td>\n",
       "      <td>1</td>\n",
       "      <td>0</td>\n",
       "      <td>0</td>\n",
       "      <td>...</td>\n",
       "      <td>0</td>\n",
       "      <td>0</td>\n",
       "      <td>0</td>\n",
       "      <td>1</td>\n",
       "      <td>0</td>\n",
       "      <td>0</td>\n",
       "      <td>0</td>\n",
       "      <td>0</td>\n",
       "      <td>0</td>\n",
       "      <td>0</td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>\n",
       "<p>5 rows × 30 columns</p>\n",
       "</div>"
      ],
      "text/plain": [
       "   Age  Credit_amount  Duration  Credit_Risk  Sex_female  Sex_male  \\\n",
       "0   67           1169         6            0           0         1   \n",
       "1   22           5951        48            1           1         0   \n",
       "2   49           2096        12            0           0         1   \n",
       "3   45           7882        42            0           0         1   \n",
       "4   53           4870        24            1           0         1   \n",
       "\n",
       "   Job_highlyskilled  Job_skilled  Job_unskilled_nonresident  \\\n",
       "0                  0            1                          0   \n",
       "1                  0            1                          0   \n",
       "2                  0            0                          0   \n",
       "3                  0            1                          0   \n",
       "4                  0            1                          0   \n",
       "\n",
       "   Job_unskilled_resident  ...  Checking_account_none  Checking_account_rich  \\\n",
       "0                       0  ...                      0                      0   \n",
       "1                       0  ...                      0                      0   \n",
       "2                       1  ...                      1                      0   \n",
       "3                       0  ...                      0                      0   \n",
       "4                       0  ...                      0                      0   \n",
       "\n",
       "   Purpose_business  Purpose_car  Purpose_domestic_appliances  \\\n",
       "0                 0            0                            0   \n",
       "1                 0            0                            0   \n",
       "2                 0            0                            0   \n",
       "3                 0            0                            0   \n",
       "4                 0            1                            0   \n",
       "\n",
       "   Purpose_education  Purpose_furniture_equipment  Purpose_radio_TV  \\\n",
       "0                  0                            0                 1   \n",
       "1                  0                            0                 1   \n",
       "2                  1                            0                 0   \n",
       "3                  0                            1                 0   \n",
       "4                  0                            0                 0   \n",
       "\n",
       "   Purpose_repairs  Purpose_vacation_others  \n",
       "0                0                        0  \n",
       "1                0                        0  \n",
       "2                0                        0  \n",
       "3                0                        0  \n",
       "4                0                        0  \n",
       "\n",
       "[5 rows x 30 columns]"
      ]
     },
     "metadata": {},
     "output_type": "display_data"
    },
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "<class 'pandas.core.frame.DataFrame'>\n",
      "RangeIndex: 954 entries, 0 to 953\n",
      "Data columns (total 30 columns):\n",
      " #   Column                       Non-Null Count  Dtype\n",
      "---  ------                       --------------  -----\n",
      " 0   Age                          954 non-null    int64\n",
      " 1   Credit_amount                954 non-null    int64\n",
      " 2   Duration                     954 non-null    int64\n",
      " 3   Credit_Risk                  954 non-null    int64\n",
      " 4   Sex_female                   954 non-null    int64\n",
      " 5   Sex_male                     954 non-null    int64\n",
      " 6   Job_highlyskilled            954 non-null    int64\n",
      " 7   Job_skilled                  954 non-null    int64\n",
      " 8   Job_unskilled_nonresident    954 non-null    int64\n",
      " 9   Job_unskilled_resident       954 non-null    int64\n",
      " 10  Housing_free                 954 non-null    int64\n",
      " 11  Housing_own                  954 non-null    int64\n",
      " 12  Housing_rent                 954 non-null    int64\n",
      " 13  Saving_accounts_little       954 non-null    int64\n",
      " 14  Saving_accounts_moderate     954 non-null    int64\n",
      " 15  Saving_accounts_none         954 non-null    int64\n",
      " 16  Saving_accounts_quite_rich   954 non-null    int64\n",
      " 17  Saving_accounts_rich         954 non-null    int64\n",
      " 18  Checking_account_little      954 non-null    int64\n",
      " 19  Checking_account_moderate    954 non-null    int64\n",
      " 20  Checking_account_none        954 non-null    int64\n",
      " 21  Checking_account_rich        954 non-null    int64\n",
      " 22  Purpose_business             954 non-null    int64\n",
      " 23  Purpose_car                  954 non-null    int64\n",
      " 24  Purpose_domestic_appliances  954 non-null    int64\n",
      " 25  Purpose_education            954 non-null    int64\n",
      " 26  Purpose_furniture_equipment  954 non-null    int64\n",
      " 27  Purpose_radio_TV             954 non-null    int64\n",
      " 28  Purpose_repairs              954 non-null    int64\n",
      " 29  Purpose_vacation_others      954 non-null    int64\n",
      "dtypes: int64(30)\n",
      "memory usage: 223.7 KB\n"
     ]
    },
    {
     "data": {
      "text/plain": [
       "None"
      ]
     },
     "metadata": {},
     "output_type": "display_data"
    }
   ],
   "source": [
    "preprocessed_data = original_data.copy()\n",
    "\n",
    "# For savings and checking accounts, we will replace the missing values with 'none':\n",
    "preprocessed_data['Saving accounts'].fillna('none', inplace=True)\n",
    "preprocessed_data['Checking account'].fillna('none', inplace=True)\n",
    "\n",
    "# Dropping index column:\n",
    "preprocessed_data.drop(columns=['Unnamed: 0'], inplace=True)\n",
    "\n",
    "# Using pd.dummies to one-hot-encode the categorical features\n",
    "preprocessed_data[\"Job\"] = preprocessed_data[\"Job\"].map({0: 'unskilled_nonresident', 1: 'unskilled_resident',\n",
    "                                                         2: 'skilled', 3: 'highlyskilled'})\n",
    "\n",
    "categorical_features = preprocessed_data.select_dtypes(include='object').columns\n",
    "numerical_features = preprocessed_data.select_dtypes(include='number').columns.drop('Credit Risk')\n",
    "print(f'Categorical features: {categorical_features}')\n",
    "print(f'Numerical features: {numerical_features}')\n",
    "\n",
    "preprocessed_data = pd.get_dummies(preprocessed_data, columns=categorical_features, dtype='int64')\n",
    "\n",
    "# Remapping the target variable to 0 and 1:\n",
    "preprocessed_data['Credit Risk'] = preprocessed_data['Credit Risk'].map({1: 0, 2: 1})\n",
    "\n",
    "# Make sure all column names are valid python identifiers (important for pd.query() calls):\n",
    "preprocessed_data.columns = preprocessed_data.columns.str.replace(' ', '_')\n",
    "preprocessed_data.columns = preprocessed_data.columns.str.replace('/', '_')\n",
    "\n",
    "display(preprocessed_data.head())\n",
    "display(preprocessed_data.info())"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 7,
   "metadata": {},
   "outputs": [],
   "source": [
    "y = preprocessed_data['Credit_Risk']\n",
    "X = preprocessed_data.drop(columns='Credit_Risk')\n",
    "\n",
    "X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 8,
   "metadata": {},
   "outputs": [
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "Accuracy: 0.7696335078534031\n",
      "ROC AUC: 0.6830357142857143\n"
     ]
    }
   ],
   "source": [
    "clf = RandomForestClassifier(random_state=42)\n",
    "clf.fit(X_train, y_train)\n",
    "\n",
    "y_pred = clf.predict(X_test)\n",
    "\n",
    "print(f'Accuracy: {accuracy_score(y_test, y_pred)}')\n",
    "print(f'ROC AUC: {roc_auc_score(y_test, y_pred)}')"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "# Applying the Aggregate Explainer"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {},
   "outputs": [],
   "source": [
    "agg_explainer = AggregatedExplainer(\n",
    "    explainer_types=[LimeWrapper, ShapTabularTreeWrapper, AnchorWrapper],       # Wrapped explainers whose explanations will be aggregated\n",
    "    model=clf, X_train=X_train, categorical_feature_names=categorical_features, # Model and training data\n",
    "    metrics=['nrc', 'sensitivity_spearman', 'faithfulness_corr'],               # Metrics to be considered for the aggregation\n",
    "    noise_gen_args={'encoding_dim': 5, 'epochs': 500},                          # Arguments passed to the autoencoder noisy data generator\n",
    "    evaluator_args={\"debug\": False}                                             # Arguments passed to the evaluator class \n",
    ")                                                       "
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 11,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/html": [
       "<style type=\"text/css\">\n",
       "</style>\n",
       "<table id=\"T_e3d68\" style='display:inline'>\n",
       "  <caption><strong>Feature importance scores:</strong></caption>\n",
       "  <thead>\n",
       "    <tr>\n",
       "      <th class=\"blank level0\" >&nbsp;</th>\n",
       "      <th id=\"T_e3d68_level0_col0\" class=\"col_heading level0 col0\" >feature</th>\n",
       "      <th id=\"T_e3d68_level0_col1\" class=\"col_heading level0 col1\" >score</th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <th id=\"T_e3d68_level0_row0\" class=\"row_heading level0 row0\" >0</th>\n",
       "      <td id=\"T_e3d68_row0_col0\" class=\"data row0 col0\" >Duration</td>\n",
       "      <td id=\"T_e3d68_row0_col1\" class=\"data row0 col1\" >0.809114</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_e3d68_level0_row1\" class=\"row_heading level0 row1\" >1</th>\n",
       "      <td id=\"T_e3d68_row1_col0\" class=\"data row1 col0\" >Purpose_furniture_equipment</td>\n",
       "      <td id=\"T_e3d68_row1_col1\" class=\"data row1 col1\" >0.568681</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_e3d68_level0_row2\" class=\"row_heading level0 row2\" >2</th>\n",
       "      <td id=\"T_e3d68_row2_col0\" class=\"data row2 col0\" >Checking_account_none</td>\n",
       "      <td id=\"T_e3d68_row2_col1\" class=\"data row2 col1\" >0.497863</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_e3d68_level0_row3\" class=\"row_heading level0 row3\" >3</th>\n",
       "      <td id=\"T_e3d68_row3_col0\" class=\"data row3 col0\" >Age</td>\n",
       "      <td id=\"T_e3d68_row3_col1\" class=\"data row3 col1\" >0.232698</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_e3d68_level0_row4\" class=\"row_heading level0 row4\" >4</th>\n",
       "      <td id=\"T_e3d68_row4_col0\" class=\"data row4 col0\" >Checking_account_little</td>\n",
       "      <td id=\"T_e3d68_row4_col1\" class=\"data row4 col1\" >0.111593</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_e3d68_level0_row5\" class=\"row_heading level0 row5\" >5</th>\n",
       "      <td id=\"T_e3d68_row5_col0\" class=\"data row5 col0\" >Credit_amount</td>\n",
       "      <td id=\"T_e3d68_row5_col1\" class=\"data row5 col1\" >0.041399</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_e3d68_level0_row6\" class=\"row_heading level0 row6\" >6</th>\n",
       "      <td id=\"T_e3d68_row6_col0\" class=\"data row6 col0\" >Checking_account_moderate</td>\n",
       "      <td id=\"T_e3d68_row6_col1\" class=\"data row6 col1\" >0.039992</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_e3d68_level0_row7\" class=\"row_heading level0 row7\" >7</th>\n",
       "      <td id=\"T_e3d68_row7_col0\" class=\"data row7 col0\" >Housing_free</td>\n",
       "      <td id=\"T_e3d68_row7_col1\" class=\"data row7 col1\" >0.027987</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_e3d68_level0_row8\" class=\"row_heading level0 row8\" >8</th>\n",
       "      <td id=\"T_e3d68_row8_col0\" class=\"data row8 col0\" >Sex_female</td>\n",
       "      <td id=\"T_e3d68_row8_col1\" class=\"data row8 col1\" >0.018932</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_e3d68_level0_row9\" class=\"row_heading level0 row9\" >9</th>\n",
       "      <td id=\"T_e3d68_row9_col0\" class=\"data row9 col0\" >Saving_accounts_moderate</td>\n",
       "      <td id=\"T_e3d68_row9_col1\" class=\"data row9 col1\" >0.015219</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_e3d68_level0_row10\" class=\"row_heading level0 row10\" >10</th>\n",
       "      <td id=\"T_e3d68_row10_col0\" class=\"data row10 col0\" >Sex_male</td>\n",
       "      <td id=\"T_e3d68_row10_col1\" class=\"data row10 col1\" >0.014925</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_e3d68_level0_row11\" class=\"row_heading level0 row11\" >11</th>\n",
       "      <td id=\"T_e3d68_row11_col0\" class=\"data row11 col0\" >Job_highlyskilled</td>\n",
       "      <td id=\"T_e3d68_row11_col1\" class=\"data row11 col1\" >0.009129</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_e3d68_level0_row12\" class=\"row_heading level0 row12\" >12</th>\n",
       "      <td id=\"T_e3d68_row12_col0\" class=\"data row12 col0\" >Housing_own</td>\n",
       "      <td id=\"T_e3d68_row12_col1\" class=\"data row12 col1\" >0.008308</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_e3d68_level0_row13\" class=\"row_heading level0 row13\" >13</th>\n",
       "      <td id=\"T_e3d68_row13_col0\" class=\"data row13 col0\" >Purpose_car</td>\n",
       "      <td id=\"T_e3d68_row13_col1\" class=\"data row13 col1\" >0.008169</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_e3d68_level0_row14\" class=\"row_heading level0 row14\" >14</th>\n",
       "      <td id=\"T_e3d68_row14_col0\" class=\"data row14 col0\" >Saving_accounts_little</td>\n",
       "      <td id=\"T_e3d68_row14_col1\" class=\"data row14 col1\" >0.006912</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_e3d68_level0_row15\" class=\"row_heading level0 row15\" >15</th>\n",
       "      <td id=\"T_e3d68_row15_col0\" class=\"data row15 col0\" >Purpose_radio_TV</td>\n",
       "      <td id=\"T_e3d68_row15_col1\" class=\"data row15 col1\" >0.006733</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_e3d68_level0_row16\" class=\"row_heading level0 row16\" >16</th>\n",
       "      <td id=\"T_e3d68_row16_col0\" class=\"data row16 col0\" >Job_skilled</td>\n",
       "      <td id=\"T_e3d68_row16_col1\" class=\"data row16 col1\" >0.006117</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_e3d68_level0_row17\" class=\"row_heading level0 row17\" >17</th>\n",
       "      <td id=\"T_e3d68_row17_col0\" class=\"data row17 col0\" >Saving_accounts_none</td>\n",
       "      <td id=\"T_e3d68_row17_col1\" class=\"data row17 col1\" >0.006015</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_e3d68_level0_row18\" class=\"row_heading level0 row18\" >18</th>\n",
       "      <td id=\"T_e3d68_row18_col0\" class=\"data row18 col0\" >Job_unskilled_resident</td>\n",
       "      <td id=\"T_e3d68_row18_col1\" class=\"data row18 col1\" >0.005921</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_e3d68_level0_row19\" class=\"row_heading level0 row19\" >19</th>\n",
       "      <td id=\"T_e3d68_row19_col0\" class=\"data row19 col0\" >Housing_rent</td>\n",
       "      <td id=\"T_e3d68_row19_col1\" class=\"data row19 col1\" >0.004658</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_e3d68_level0_row20\" class=\"row_heading level0 row20\" >20</th>\n",
       "      <td id=\"T_e3d68_row20_col0\" class=\"data row20 col0\" >Job_unskilled_nonresident</td>\n",
       "      <td id=\"T_e3d68_row20_col1\" class=\"data row20 col1\" >0.004482</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_e3d68_level0_row21\" class=\"row_heading level0 row21\" >21</th>\n",
       "      <td id=\"T_e3d68_row21_col0\" class=\"data row21 col0\" >Saving_accounts_quite_rich</td>\n",
       "      <td id=\"T_e3d68_row21_col1\" class=\"data row21 col1\" >0.002573</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_e3d68_level0_row22\" class=\"row_heading level0 row22\" >22</th>\n",
       "      <td id=\"T_e3d68_row22_col0\" class=\"data row22 col0\" >Purpose_education</td>\n",
       "      <td id=\"T_e3d68_row22_col1\" class=\"data row22 col1\" >0.002123</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_e3d68_level0_row23\" class=\"row_heading level0 row23\" >23</th>\n",
       "      <td id=\"T_e3d68_row23_col0\" class=\"data row23 col0\" >Purpose_repairs</td>\n",
       "      <td id=\"T_e3d68_row23_col1\" class=\"data row23 col1\" >0.001111</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_e3d68_level0_row24\" class=\"row_heading level0 row24\" >24</th>\n",
       "      <td id=\"T_e3d68_row24_col0\" class=\"data row24 col0\" >Purpose_business</td>\n",
       "      <td id=\"T_e3d68_row24_col1\" class=\"data row24 col1\" >0.000986</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_e3d68_level0_row25\" class=\"row_heading level0 row25\" >25</th>\n",
       "      <td id=\"T_e3d68_row25_col0\" class=\"data row25 col0\" >Purpose_vacation_others</td>\n",
       "      <td id=\"T_e3d68_row25_col1\" class=\"data row25 col1\" >0.000942</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_e3d68_level0_row26\" class=\"row_heading level0 row26\" >26</th>\n",
       "      <td id=\"T_e3d68_row26_col0\" class=\"data row26 col0\" >Checking_account_rich</td>\n",
       "      <td id=\"T_e3d68_row26_col1\" class=\"data row26 col1\" >0.000937</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_e3d68_level0_row27\" class=\"row_heading level0 row27\" >27</th>\n",
       "      <td id=\"T_e3d68_row27_col0\" class=\"data row27 col0\" >Saving_accounts_rich</td>\n",
       "      <td id=\"T_e3d68_row27_col1\" class=\"data row27 col1\" >0.000645</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_e3d68_level0_row28\" class=\"row_heading level0 row28\" >28</th>\n",
       "      <td id=\"T_e3d68_row28_col0\" class=\"data row28 col0\" >Purpose_domestic_appliances</td>\n",
       "      <td id=\"T_e3d68_row28_col1\" class=\"data row28 col1\" >0.000545</td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>\n",
       "   <style type=\"text/css\">\n",
       "</style>\n",
       "<table id=\"T_cc908\" style='display:inline'>\n",
       "  <caption><strong>Feature importance ranking:</strong></caption>\n",
       "  <thead>\n",
       "    <tr>\n",
       "      <th class=\"blank level0\" >&nbsp;</th>\n",
       "      <th id=\"T_cc908_level0_col0\" class=\"col_heading level0 col0\" >feature</th>\n",
       "      <th id=\"T_cc908_level0_col1\" class=\"col_heading level0 col1\" >rank</th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <th id=\"T_cc908_level0_row0\" class=\"row_heading level0 row0\" >0</th>\n",
       "      <td id=\"T_cc908_row0_col0\" class=\"data row0 col0\" >Duration</td>\n",
       "      <td id=\"T_cc908_row0_col1\" class=\"data row0 col1\" >1</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_cc908_level0_row1\" class=\"row_heading level0 row1\" >1</th>\n",
       "      <td id=\"T_cc908_row1_col0\" class=\"data row1 col0\" >Purpose_furniture_equipment</td>\n",
       "      <td id=\"T_cc908_row1_col1\" class=\"data row1 col1\" >2</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_cc908_level0_row2\" class=\"row_heading level0 row2\" >2</th>\n",
       "      <td id=\"T_cc908_row2_col0\" class=\"data row2 col0\" >Checking_account_none</td>\n",
       "      <td id=\"T_cc908_row2_col1\" class=\"data row2 col1\" >3</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_cc908_level0_row3\" class=\"row_heading level0 row3\" >3</th>\n",
       "      <td id=\"T_cc908_row3_col0\" class=\"data row3 col0\" >Age</td>\n",
       "      <td id=\"T_cc908_row3_col1\" class=\"data row3 col1\" >4</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_cc908_level0_row4\" class=\"row_heading level0 row4\" >4</th>\n",
       "      <td id=\"T_cc908_row4_col0\" class=\"data row4 col0\" >Checking_account_little</td>\n",
       "      <td id=\"T_cc908_row4_col1\" class=\"data row4 col1\" >5</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_cc908_level0_row5\" class=\"row_heading level0 row5\" >5</th>\n",
       "      <td id=\"T_cc908_row5_col0\" class=\"data row5 col0\" >Credit_amount</td>\n",
       "      <td id=\"T_cc908_row5_col1\" class=\"data row5 col1\" >6</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_cc908_level0_row6\" class=\"row_heading level0 row6\" >6</th>\n",
       "      <td id=\"T_cc908_row6_col0\" class=\"data row6 col0\" >Checking_account_moderate</td>\n",
       "      <td id=\"T_cc908_row6_col1\" class=\"data row6 col1\" >6</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_cc908_level0_row7\" class=\"row_heading level0 row7\" >7</th>\n",
       "      <td id=\"T_cc908_row7_col0\" class=\"data row7 col0\" >Housing_free</td>\n",
       "      <td id=\"T_cc908_row7_col1\" class=\"data row7 col1\" >7</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_cc908_level0_row8\" class=\"row_heading level0 row8\" >8</th>\n",
       "      <td id=\"T_cc908_row8_col0\" class=\"data row8 col0\" >Sex_female</td>\n",
       "      <td id=\"T_cc908_row8_col1\" class=\"data row8 col1\" >7</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_cc908_level0_row9\" class=\"row_heading level0 row9\" >9</th>\n",
       "      <td id=\"T_cc908_row9_col0\" class=\"data row9 col0\" >Saving_accounts_moderate</td>\n",
       "      <td id=\"T_cc908_row9_col1\" class=\"data row9 col1\" >8</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_cc908_level0_row10\" class=\"row_heading level0 row10\" >10</th>\n",
       "      <td id=\"T_cc908_row10_col0\" class=\"data row10 col0\" >Sex_male</td>\n",
       "      <td id=\"T_cc908_row10_col1\" class=\"data row10 col1\" >8</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_cc908_level0_row11\" class=\"row_heading level0 row11\" >11</th>\n",
       "      <td id=\"T_cc908_row11_col0\" class=\"data row11 col0\" >Job_highlyskilled</td>\n",
       "      <td id=\"T_cc908_row11_col1\" class=\"data row11 col1\" >8</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_cc908_level0_row12\" class=\"row_heading level0 row12\" >12</th>\n",
       "      <td id=\"T_cc908_row12_col0\" class=\"data row12 col0\" >Housing_own</td>\n",
       "      <td id=\"T_cc908_row12_col1\" class=\"data row12 col1\" >8</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_cc908_level0_row13\" class=\"row_heading level0 row13\" >13</th>\n",
       "      <td id=\"T_cc908_row13_col0\" class=\"data row13 col0\" >Purpose_car</td>\n",
       "      <td id=\"T_cc908_row13_col1\" class=\"data row13 col1\" >8</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_cc908_level0_row14\" class=\"row_heading level0 row14\" >14</th>\n",
       "      <td id=\"T_cc908_row14_col0\" class=\"data row14 col0\" >Saving_accounts_little</td>\n",
       "      <td id=\"T_cc908_row14_col1\" class=\"data row14 col1\" >8</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_cc908_level0_row15\" class=\"row_heading level0 row15\" >15</th>\n",
       "      <td id=\"T_cc908_row15_col0\" class=\"data row15 col0\" >Purpose_radio_TV</td>\n",
       "      <td id=\"T_cc908_row15_col1\" class=\"data row15 col1\" >8</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_cc908_level0_row16\" class=\"row_heading level0 row16\" >16</th>\n",
       "      <td id=\"T_cc908_row16_col0\" class=\"data row16 col0\" >Job_skilled</td>\n",
       "      <td id=\"T_cc908_row16_col1\" class=\"data row16 col1\" >8</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_cc908_level0_row17\" class=\"row_heading level0 row17\" >17</th>\n",
       "      <td id=\"T_cc908_row17_col0\" class=\"data row17 col0\" >Saving_accounts_none</td>\n",
       "      <td id=\"T_cc908_row17_col1\" class=\"data row17 col1\" >8</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_cc908_level0_row18\" class=\"row_heading level0 row18\" >18</th>\n",
       "      <td id=\"T_cc908_row18_col0\" class=\"data row18 col0\" >Job_unskilled_resident</td>\n",
       "      <td id=\"T_cc908_row18_col1\" class=\"data row18 col1\" >8</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_cc908_level0_row19\" class=\"row_heading level0 row19\" >19</th>\n",
       "      <td id=\"T_cc908_row19_col0\" class=\"data row19 col0\" >Housing_rent</td>\n",
       "      <td id=\"T_cc908_row19_col1\" class=\"data row19 col1\" >9</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_cc908_level0_row20\" class=\"row_heading level0 row20\" >20</th>\n",
       "      <td id=\"T_cc908_row20_col0\" class=\"data row20 col0\" >Job_unskilled_nonresident</td>\n",
       "      <td id=\"T_cc908_row20_col1\" class=\"data row20 col1\" >9</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_cc908_level0_row21\" class=\"row_heading level0 row21\" >21</th>\n",
       "      <td id=\"T_cc908_row21_col0\" class=\"data row21 col0\" >Saving_accounts_quite_rich</td>\n",
       "      <td id=\"T_cc908_row21_col1\" class=\"data row21 col1\" >9</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_cc908_level0_row22\" class=\"row_heading level0 row22\" >22</th>\n",
       "      <td id=\"T_cc908_row22_col0\" class=\"data row22 col0\" >Purpose_education</td>\n",
       "      <td id=\"T_cc908_row22_col1\" class=\"data row22 col1\" >9</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_cc908_level0_row23\" class=\"row_heading level0 row23\" >23</th>\n",
       "      <td id=\"T_cc908_row23_col0\" class=\"data row23 col0\" >Purpose_repairs</td>\n",
       "      <td id=\"T_cc908_row23_col1\" class=\"data row23 col1\" >9</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_cc908_level0_row24\" class=\"row_heading level0 row24\" >24</th>\n",
       "      <td id=\"T_cc908_row24_col0\" class=\"data row24 col0\" >Purpose_business</td>\n",
       "      <td id=\"T_cc908_row24_col1\" class=\"data row24 col1\" >9</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_cc908_level0_row25\" class=\"row_heading level0 row25\" >25</th>\n",
       "      <td id=\"T_cc908_row25_col0\" class=\"data row25 col0\" >Purpose_vacation_others</td>\n",
       "      <td id=\"T_cc908_row25_col1\" class=\"data row25 col1\" >9</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_cc908_level0_row26\" class=\"row_heading level0 row26\" >26</th>\n",
       "      <td id=\"T_cc908_row26_col0\" class=\"data row26 col0\" >Checking_account_rich</td>\n",
       "      <td id=\"T_cc908_row26_col1\" class=\"data row26 col1\" >9</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_cc908_level0_row27\" class=\"row_heading level0 row27\" >27</th>\n",
       "      <td id=\"T_cc908_row27_col0\" class=\"data row27 col0\" >Saving_accounts_rich</td>\n",
       "      <td id=\"T_cc908_row27_col1\" class=\"data row27 col1\" >9</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_cc908_level0_row28\" class=\"row_heading level0 row28\" >28</th>\n",
       "      <td id=\"T_cc908_row28_col0\" class=\"data row28 col0\" >Purpose_domestic_appliances</td>\n",
       "      <td id=\"T_cc908_row28_col1\" class=\"data row28 col1\" >9</td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>\n",
       "   "
      ],
      "text/plain": [
       "<IPython.core.display.HTML object>"
      ]
     },
     "metadata": {},
     "output_type": "display_data"
    }
   ],
   "source": [
    "# Apply the aggregate explainer on a sample instance:\n",
    "sample_idx = 0\n",
    "agg_explanation = agg_explainer.explain_instance(X_test.iloc[sample_idx])\n",
    "\n",
    "display_side_by_side([agg_explanation, get_ranked_explanation(agg_explanation)], captions=['Feature importance scores:', 'Feature importance ranking:'])"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "### Get information on the aggregate explainer's last explanation\n",
    "With the `get_last_explanation_info()` method, you can get a dataframe that contains each of the aggregated explanation models' performances on each of the metrics used to evaluate them. You are also given the weight each explanation model got from the MCDM algorithm, which is passed on to the rank aggregation step."
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 24,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/html": [
       "<div>\n",
       "<style scoped>\n",
       "    .dataframe tbody tr th:only-of-type {\n",
       "        vertical-align: middle;\n",
       "    }\n",
       "\n",
       "    .dataframe tbody tr th {\n",
       "        vertical-align: top;\n",
       "    }\n",
       "\n",
       "    .dataframe thead th {\n",
       "        text-align: right;\n",
       "    }\n",
       "</style>\n",
       "<table border=\"1\" class=\"dataframe\">\n",
       "  <thead>\n",
       "    <tr style=\"text-align: right;\">\n",
       "      <th></th>\n",
       "      <th>nrc</th>\n",
       "      <th>sensitivity_spearman</th>\n",
       "      <th>faithfulness_corr</th>\n",
       "      <th>weight</th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <th>LimeWrapper</th>\n",
       "      <td>42.504547</td>\n",
       "      <td>0.839113</td>\n",
       "      <td>0.110158</td>\n",
       "      <td>0.533547</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>ShapTabularTreeWrapper</th>\n",
       "      <td>43.531226</td>\n",
       "      <td>0.964205</td>\n",
       "      <td>0.167030</td>\n",
       "      <td>0.438026</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>AnchorWrapper</th>\n",
       "      <td>42.491709</td>\n",
       "      <td>0.570668</td>\n",
       "      <td>0.448899</td>\n",
       "      <td>0.585786</td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>\n",
       "</div>"
      ],
      "text/plain": [
       "                              nrc  sensitivity_spearman  faithfulness_corr  \\\n",
       "LimeWrapper             42.504547              0.839113           0.110158   \n",
       "ShapTabularTreeWrapper  43.531226              0.964205           0.167030   \n",
       "AnchorWrapper           42.491709              0.570668           0.448899   \n",
       "\n",
       "                          weight  \n",
       "LimeWrapper             0.533547  \n",
       "ShapTabularTreeWrapper  0.438026  \n",
       "AnchorWrapper           0.585786  "
      ]
     },
     "execution_count": 24,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "agg_explainer.get_last_explanation_info()"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 25,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/html": [
       "<style type=\"text/css\">\n",
       "</style>\n",
       "<table id=\"T_b62bf\" style='display:inline'>\n",
       "  <caption><strong>LIME explanation:</strong></caption>\n",
       "  <thead>\n",
       "    <tr>\n",
       "      <th class=\"blank level0\" >&nbsp;</th>\n",
       "      <th id=\"T_b62bf_level0_col0\" class=\"col_heading level0 col0\" >feature</th>\n",
       "      <th id=\"T_b62bf_level0_col1\" class=\"col_heading level0 col1\" >score</th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <th id=\"T_b62bf_level0_row0\" class=\"row_heading level0 row0\" >0</th>\n",
       "      <td id=\"T_b62bf_row0_col0\" class=\"data row0 col0\" >Checking_account_none</td>\n",
       "      <td id=\"T_b62bf_row0_col1\" class=\"data row0 col1\" >0.060765</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_b62bf_level0_row1\" class=\"row_heading level0 row1\" >1</th>\n",
       "      <td id=\"T_b62bf_row1_col0\" class=\"data row1 col0\" >Duration</td>\n",
       "      <td id=\"T_b62bf_row1_col1\" class=\"data row1 col1\" >0.056665</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_b62bf_level0_row2\" class=\"row_heading level0 row2\" >2</th>\n",
       "      <td id=\"T_b62bf_row2_col0\" class=\"data row2 col0\" >Checking_account_little</td>\n",
       "      <td id=\"T_b62bf_row2_col1\" class=\"data row2 col1\" >0.035393</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_b62bf_level0_row3\" class=\"row_heading level0 row3\" >3</th>\n",
       "      <td id=\"T_b62bf_row3_col0\" class=\"data row3 col0\" >Age</td>\n",
       "      <td id=\"T_b62bf_row3_col1\" class=\"data row3 col1\" >0.028167</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_b62bf_level0_row4\" class=\"row_heading level0 row4\" >4</th>\n",
       "      <td id=\"T_b62bf_row4_col0\" class=\"data row4 col0\" >Checking_account_moderate</td>\n",
       "      <td id=\"T_b62bf_row4_col1\" class=\"data row4 col1\" >0.017343</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_b62bf_level0_row5\" class=\"row_heading level0 row5\" >5</th>\n",
       "      <td id=\"T_b62bf_row5_col0\" class=\"data row5 col0\" >Housing_own</td>\n",
       "      <td id=\"T_b62bf_row5_col1\" class=\"data row5 col1\" >0.013374</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_b62bf_level0_row6\" class=\"row_heading level0 row6\" >6</th>\n",
       "      <td id=\"T_b62bf_row6_col0\" class=\"data row6 col0\" >Saving_accounts_little</td>\n",
       "      <td id=\"T_b62bf_row6_col1\" class=\"data row6 col1\" >0.009622</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_b62bf_level0_row7\" class=\"row_heading level0 row7\" >7</th>\n",
       "      <td id=\"T_b62bf_row7_col0\" class=\"data row7 col0\" >Credit_amount</td>\n",
       "      <td id=\"T_b62bf_row7_col1\" class=\"data row7 col1\" >0.008884</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_b62bf_level0_row8\" class=\"row_heading level0 row8\" >8</th>\n",
       "      <td id=\"T_b62bf_row8_col0\" class=\"data row8 col0\" >Housing_rent</td>\n",
       "      <td id=\"T_b62bf_row8_col1\" class=\"data row8 col1\" >0.008133</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_b62bf_level0_row9\" class=\"row_heading level0 row9\" >9</th>\n",
       "      <td id=\"T_b62bf_row9_col0\" class=\"data row9 col0\" >Sex_male</td>\n",
       "      <td id=\"T_b62bf_row9_col1\" class=\"data row9 col1\" >0.007520</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_b62bf_level0_row10\" class=\"row_heading level0 row10\" >10</th>\n",
       "      <td id=\"T_b62bf_row10_col0\" class=\"data row10 col0\" >Purpose_radio_TV</td>\n",
       "      <td id=\"T_b62bf_row10_col1\" class=\"data row10 col1\" >0.006844</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_b62bf_level0_row11\" class=\"row_heading level0 row11\" >11</th>\n",
       "      <td id=\"T_b62bf_row11_col0\" class=\"data row11 col0\" >Purpose_car</td>\n",
       "      <td id=\"T_b62bf_row11_col1\" class=\"data row11 col1\" >0.006059</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_b62bf_level0_row12\" class=\"row_heading level0 row12\" >12</th>\n",
       "      <td id=\"T_b62bf_row12_col0\" class=\"data row12 col0\" >Saving_accounts_none</td>\n",
       "      <td id=\"T_b62bf_row12_col1\" class=\"data row12 col1\" >0.005942</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_b62bf_level0_row13\" class=\"row_heading level0 row13\" >13</th>\n",
       "      <td id=\"T_b62bf_row13_col0\" class=\"data row13 col0\" >Housing_free</td>\n",
       "      <td id=\"T_b62bf_row13_col1\" class=\"data row13 col1\" >0.005901</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_b62bf_level0_row14\" class=\"row_heading level0 row14\" >14</th>\n",
       "      <td id=\"T_b62bf_row14_col0\" class=\"data row14 col0\" >Sex_female</td>\n",
       "      <td id=\"T_b62bf_row14_col1\" class=\"data row14 col1\" >0.004537</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_b62bf_level0_row15\" class=\"row_heading level0 row15\" >15</th>\n",
       "      <td id=\"T_b62bf_row15_col0\" class=\"data row15 col0\" >Saving_accounts_rich</td>\n",
       "      <td id=\"T_b62bf_row15_col1\" class=\"data row15 col1\" >0.004407</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_b62bf_level0_row16\" class=\"row_heading level0 row16\" >16</th>\n",
       "      <td id=\"T_b62bf_row16_col0\" class=\"data row16 col0\" >Purpose_education</td>\n",
       "      <td id=\"T_b62bf_row16_col1\" class=\"data row16 col1\" >0.003162</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_b62bf_level0_row17\" class=\"row_heading level0 row17\" >17</th>\n",
       "      <td id=\"T_b62bf_row17_col0\" class=\"data row17 col0\" >Job_skilled</td>\n",
       "      <td id=\"T_b62bf_row17_col1\" class=\"data row17 col1\" >0.002704</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_b62bf_level0_row18\" class=\"row_heading level0 row18\" >18</th>\n",
       "      <td id=\"T_b62bf_row18_col0\" class=\"data row18 col0\" >Saving_accounts_moderate</td>\n",
       "      <td id=\"T_b62bf_row18_col1\" class=\"data row18 col1\" >0.002680</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_b62bf_level0_row19\" class=\"row_heading level0 row19\" >19</th>\n",
       "      <td id=\"T_b62bf_row19_col0\" class=\"data row19 col0\" >Purpose_vacation_others</td>\n",
       "      <td id=\"T_b62bf_row19_col1\" class=\"data row19 col1\" >0.002339</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_b62bf_level0_row20\" class=\"row_heading level0 row20\" >20</th>\n",
       "      <td id=\"T_b62bf_row20_col0\" class=\"data row20 col0\" >Checking_account_rich</td>\n",
       "      <td id=\"T_b62bf_row20_col1\" class=\"data row20 col1\" >0.002247</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_b62bf_level0_row21\" class=\"row_heading level0 row21\" >21</th>\n",
       "      <td id=\"T_b62bf_row21_col0\" class=\"data row21 col0\" >Job_unskilled_nonresident</td>\n",
       "      <td id=\"T_b62bf_row21_col1\" class=\"data row21 col1\" >0.001711</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_b62bf_level0_row22\" class=\"row_heading level0 row22\" >22</th>\n",
       "      <td id=\"T_b62bf_row22_col0\" class=\"data row22 col0\" >Purpose_repairs</td>\n",
       "      <td id=\"T_b62bf_row22_col1\" class=\"data row22 col1\" >0.001627</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_b62bf_level0_row23\" class=\"row_heading level0 row23\" >23</th>\n",
       "      <td id=\"T_b62bf_row23_col0\" class=\"data row23 col0\" >Purpose_furniture_equipment</td>\n",
       "      <td id=\"T_b62bf_row23_col1\" class=\"data row23 col1\" >0.001377</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_b62bf_level0_row24\" class=\"row_heading level0 row24\" >24</th>\n",
       "      <td id=\"T_b62bf_row24_col0\" class=\"data row24 col0\" >Purpose_domestic_appliances</td>\n",
       "      <td id=\"T_b62bf_row24_col1\" class=\"data row24 col1\" >0.001172</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_b62bf_level0_row25\" class=\"row_heading level0 row25\" >25</th>\n",
       "      <td id=\"T_b62bf_row25_col0\" class=\"data row25 col0\" >Job_highlyskilled</td>\n",
       "      <td id=\"T_b62bf_row25_col1\" class=\"data row25 col1\" >0.001144</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_b62bf_level0_row26\" class=\"row_heading level0 row26\" >26</th>\n",
       "      <td id=\"T_b62bf_row26_col0\" class=\"data row26 col0\" >Saving_accounts_quite_rich</td>\n",
       "      <td id=\"T_b62bf_row26_col1\" class=\"data row26 col1\" >0.001032</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_b62bf_level0_row27\" class=\"row_heading level0 row27\" >27</th>\n",
       "      <td id=\"T_b62bf_row27_col0\" class=\"data row27 col0\" >Job_unskilled_resident</td>\n",
       "      <td id=\"T_b62bf_row27_col1\" class=\"data row27 col1\" >0.000776</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_b62bf_level0_row28\" class=\"row_heading level0 row28\" >28</th>\n",
       "      <td id=\"T_b62bf_row28_col0\" class=\"data row28 col0\" >Purpose_business</td>\n",
       "      <td id=\"T_b62bf_row28_col1\" class=\"data row28 col1\" >0.000121</td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>\n",
       "   <style type=\"text/css\">\n",
       "</style>\n",
       "<table id=\"T_074b7\" style='display:inline'>\n",
       "  <caption><strong>SHAP explanation:</strong></caption>\n",
       "  <thead>\n",
       "    <tr>\n",
       "      <th class=\"blank level0\" >&nbsp;</th>\n",
       "      <th id=\"T_074b7_level0_col0\" class=\"col_heading level0 col0\" >feature</th>\n",
       "      <th id=\"T_074b7_level0_col1\" class=\"col_heading level0 col1\" >score</th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <th id=\"T_074b7_level0_row0\" class=\"row_heading level0 row0\" >0</th>\n",
       "      <td id=\"T_074b7_row0_col0\" class=\"data row0 col0\" >Duration</td>\n",
       "      <td id=\"T_074b7_row0_col1\" class=\"data row0 col1\" >0.051965</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_074b7_level0_row1\" class=\"row_heading level0 row1\" >1</th>\n",
       "      <td id=\"T_074b7_row1_col0\" class=\"data row1 col0\" >Checking_account_none</td>\n",
       "      <td id=\"T_074b7_row1_col1\" class=\"data row1 col1\" >0.048818</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_074b7_level0_row2\" class=\"row_heading level0 row2\" >2</th>\n",
       "      <td id=\"T_074b7_row2_col0\" class=\"data row2 col0\" >Age</td>\n",
       "      <td id=\"T_074b7_row2_col1\" class=\"data row2 col1\" >0.044427</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_074b7_level0_row3\" class=\"row_heading level0 row3\" >3</th>\n",
       "      <td id=\"T_074b7_row3_col0\" class=\"data row3 col0\" >Checking_account_little</td>\n",
       "      <td id=\"T_074b7_row3_col1\" class=\"data row3 col1\" >0.030740</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_074b7_level0_row4\" class=\"row_heading level0 row4\" >4</th>\n",
       "      <td id=\"T_074b7_row4_col0\" class=\"data row4 col0\" >Checking_account_moderate</td>\n",
       "      <td id=\"T_074b7_row4_col1\" class=\"data row4 col1\" >0.025005</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_074b7_level0_row5\" class=\"row_heading level0 row5\" >5</th>\n",
       "      <td id=\"T_074b7_row5_col0\" class=\"data row5 col0\" >Credit_amount</td>\n",
       "      <td id=\"T_074b7_row5_col1\" class=\"data row5 col1\" >0.018809</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_074b7_level0_row6\" class=\"row_heading level0 row6\" >6</th>\n",
       "      <td id=\"T_074b7_row6_col0\" class=\"data row6 col0\" >Saving_accounts_moderate</td>\n",
       "      <td id=\"T_074b7_row6_col1\" class=\"data row6 col1\" >0.011132</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_074b7_level0_row7\" class=\"row_heading level0 row7\" >7</th>\n",
       "      <td id=\"T_074b7_row7_col0\" class=\"data row7 col0\" >Purpose_furniture_equipment</td>\n",
       "      <td id=\"T_074b7_row7_col1\" class=\"data row7 col1\" >0.009065</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_074b7_level0_row8\" class=\"row_heading level0 row8\" >8</th>\n",
       "      <td id=\"T_074b7_row8_col0\" class=\"data row8 col0\" >Sex_female</td>\n",
       "      <td id=\"T_074b7_row8_col1\" class=\"data row8 col1\" >0.007021</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_074b7_level0_row9\" class=\"row_heading level0 row9\" >9</th>\n",
       "      <td id=\"T_074b7_row9_col0\" class=\"data row9 col0\" >Purpose_car</td>\n",
       "      <td id=\"T_074b7_row9_col1\" class=\"data row9 col1\" >0.006882</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_074b7_level0_row10\" class=\"row_heading level0 row10\" >10</th>\n",
       "      <td id=\"T_074b7_row10_col0\" class=\"data row10 col0\" >Housing_free</td>\n",
       "      <td id=\"T_074b7_row10_col1\" class=\"data row10 col1\" >0.006844</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_074b7_level0_row11\" class=\"row_heading level0 row11\" >11</th>\n",
       "      <td id=\"T_074b7_row11_col0\" class=\"data row11 col0\" >Saving_accounts_none</td>\n",
       "      <td id=\"T_074b7_row11_col1\" class=\"data row11 col1\" >0.004482</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_074b7_level0_row12\" class=\"row_heading level0 row12\" >12</th>\n",
       "      <td id=\"T_074b7_row12_col0\" class=\"data row12 col0\" >Sex_male</td>\n",
       "      <td id=\"T_074b7_row12_col1\" class=\"data row12 col1\" >0.004218</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_074b7_level0_row13\" class=\"row_heading level0 row13\" >13</th>\n",
       "      <td id=\"T_074b7_row13_col0\" class=\"data row13 col0\" >Job_unskilled_resident</td>\n",
       "      <td id=\"T_074b7_row13_col1\" class=\"data row13 col1\" >0.004134</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_074b7_level0_row14\" class=\"row_heading level0 row14\" >14</th>\n",
       "      <td id=\"T_074b7_row14_col0\" class=\"data row14 col0\" >Saving_accounts_little</td>\n",
       "      <td id=\"T_074b7_row14_col1\" class=\"data row14 col1\" >0.003987</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_074b7_level0_row15\" class=\"row_heading level0 row15\" >15</th>\n",
       "      <td id=\"T_074b7_row15_col0\" class=\"data row15 col0\" >Job_highlyskilled</td>\n",
       "      <td id=\"T_074b7_row15_col1\" class=\"data row15 col1\" >0.002708</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_074b7_level0_row16\" class=\"row_heading level0 row16\" >16</th>\n",
       "      <td id=\"T_074b7_row16_col0\" class=\"data row16 col0\" >Saving_accounts_quite_rich</td>\n",
       "      <td id=\"T_074b7_row16_col1\" class=\"data row16 col1\" >0.001809</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_074b7_level0_row17\" class=\"row_heading level0 row17\" >17</th>\n",
       "      <td id=\"T_074b7_row17_col0\" class=\"data row17 col0\" >Purpose_education</td>\n",
       "      <td id=\"T_074b7_row17_col1\" class=\"data row17 col1\" >0.001744</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_074b7_level0_row18\" class=\"row_heading level0 row18\" >18</th>\n",
       "      <td id=\"T_074b7_row18_col0\" class=\"data row18 col0\" >Job_skilled</td>\n",
       "      <td id=\"T_074b7_row18_col1\" class=\"data row18 col1\" >0.001720</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_074b7_level0_row19\" class=\"row_heading level0 row19\" >19</th>\n",
       "      <td id=\"T_074b7_row19_col0\" class=\"data row19 col0\" >Housing_own</td>\n",
       "      <td id=\"T_074b7_row19_col1\" class=\"data row19 col1\" >0.001668</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_074b7_level0_row20\" class=\"row_heading level0 row20\" >20</th>\n",
       "      <td id=\"T_074b7_row20_col0\" class=\"data row20 col0\" >Purpose_repairs</td>\n",
       "      <td id=\"T_074b7_row20_col1\" class=\"data row20 col1\" >0.001397</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_074b7_level0_row21\" class=\"row_heading level0 row21\" >21</th>\n",
       "      <td id=\"T_074b7_row21_col0\" class=\"data row21 col0\" >Purpose_vacation_others</td>\n",
       "      <td id=\"T_074b7_row21_col1\" class=\"data row21 col1\" >0.000760</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_074b7_level0_row22\" class=\"row_heading level0 row22\" >22</th>\n",
       "      <td id=\"T_074b7_row22_col0\" class=\"data row22 col0\" >Purpose_business</td>\n",
       "      <td id=\"T_074b7_row22_col1\" class=\"data row22 col1\" >0.000601</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_074b7_level0_row23\" class=\"row_heading level0 row23\" >23</th>\n",
       "      <td id=\"T_074b7_row23_col0\" class=\"data row23 col0\" >Saving_accounts_rich</td>\n",
       "      <td id=\"T_074b7_row23_col1\" class=\"data row23 col1\" >0.000569</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_074b7_level0_row24\" class=\"row_heading level0 row24\" >24</th>\n",
       "      <td id=\"T_074b7_row24_col0\" class=\"data row24 col0\" >Checking_account_rich</td>\n",
       "      <td id=\"T_074b7_row24_col1\" class=\"data row24 col1\" >0.000486</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_074b7_level0_row25\" class=\"row_heading level0 row25\" >25</th>\n",
       "      <td id=\"T_074b7_row25_col0\" class=\"data row25 col0\" >Purpose_radio_TV</td>\n",
       "      <td id=\"T_074b7_row25_col1\" class=\"data row25 col1\" >0.000356</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_074b7_level0_row26\" class=\"row_heading level0 row26\" >26</th>\n",
       "      <td id=\"T_074b7_row26_col0\" class=\"data row26 col0\" >Housing_rent</td>\n",
       "      <td id=\"T_074b7_row26_col1\" class=\"data row26 col1\" >0.000178</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_074b7_level0_row27\" class=\"row_heading level0 row27\" >27</th>\n",
       "      <td id=\"T_074b7_row27_col0\" class=\"data row27 col0\" >Purpose_domestic_appliances</td>\n",
       "      <td id=\"T_074b7_row27_col1\" class=\"data row27 col1\" >0.000000</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_074b7_level0_row28\" class=\"row_heading level0 row28\" >28</th>\n",
       "      <td id=\"T_074b7_row28_col0\" class=\"data row28 col0\" >Job_unskilled_nonresident</td>\n",
       "      <td id=\"T_074b7_row28_col1\" class=\"data row28 col1\" >0.000000</td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>\n",
       "   <style type=\"text/css\">\n",
       "</style>\n",
       "<table id=\"T_7a8ae\" style='display:inline'>\n",
       "  <caption><strong>Anchor explanation:</strong></caption>\n",
       "  <thead>\n",
       "    <tr>\n",
       "      <th class=\"blank level0\" >&nbsp;</th>\n",
       "      <th id=\"T_7a8ae_level0_col0\" class=\"col_heading level0 col0\" >feature</th>\n",
       "      <th id=\"T_7a8ae_level0_col1\" class=\"col_heading level0 col1\" >score</th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <th id=\"T_7a8ae_level0_row0\" class=\"row_heading level0 row0\" >0</th>\n",
       "      <td id=\"T_7a8ae_row0_col0\" class=\"data row0 col0\" >Purpose_furniture_equipment</td>\n",
       "      <td id=\"T_7a8ae_row0_col1\" class=\"data row0 col1\" >0.813893</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_7a8ae_level0_row1\" class=\"row_heading level0 row1\" >1</th>\n",
       "      <td id=\"T_7a8ae_row1_col0\" class=\"data row1 col0\" >Age</td>\n",
       "      <td id=\"T_7a8ae_row1_col1\" class=\"data row1 col1\" >0.503277</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_7a8ae_level0_row2\" class=\"row_heading level0 row2\" >2</th>\n",
       "      <td id=\"T_7a8ae_row2_col0\" class=\"data row2 col0\" >Duration</td>\n",
       "      <td id=\"T_7a8ae_row2_col1\" class=\"data row2 col1\" >0.433814</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_7a8ae_level0_row3\" class=\"row_heading level0 row3\" >3</th>\n",
       "      <td id=\"T_7a8ae_row3_col0\" class=\"data row3 col0\" >Sex_female</td>\n",
       "      <td id=\"T_7a8ae_row3_col1\" class=\"data row3 col1\" >0.313237</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_7a8ae_level0_row4\" class=\"row_heading level0 row4\" >4</th>\n",
       "      <td id=\"T_7a8ae_row4_col0\" class=\"data row4 col0\" >Housing_own</td>\n",
       "      <td id=\"T_7a8ae_row4_col1\" class=\"data row4 col1\" >0.296199</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_7a8ae_level0_row5\" class=\"row_heading level0 row5\" >5</th>\n",
       "      <td id=\"T_7a8ae_row5_col0\" class=\"data row5 col0\" >Checking_account_little</td>\n",
       "      <td id=\"T_7a8ae_row5_col1\" class=\"data row5 col1\" >0.283093</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_7a8ae_level0_row6\" class=\"row_heading level0 row6\" >6</th>\n",
       "      <td id=\"T_7a8ae_row6_col0\" class=\"data row6 col0\" >Saving_accounts_rich</td>\n",
       "      <td id=\"T_7a8ae_row6_col1\" class=\"data row6 col1\" >0.000000</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_7a8ae_level0_row7\" class=\"row_heading level0 row7\" >7</th>\n",
       "      <td id=\"T_7a8ae_row7_col0\" class=\"data row7 col0\" >Purpose_repairs</td>\n",
       "      <td id=\"T_7a8ae_row7_col1\" class=\"data row7 col1\" >0.000000</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_7a8ae_level0_row8\" class=\"row_heading level0 row8\" >8</th>\n",
       "      <td id=\"T_7a8ae_row8_col0\" class=\"data row8 col0\" >Purpose_radio_TV</td>\n",
       "      <td id=\"T_7a8ae_row8_col1\" class=\"data row8 col1\" >0.000000</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_7a8ae_level0_row9\" class=\"row_heading level0 row9\" >9</th>\n",
       "      <td id=\"T_7a8ae_row9_col0\" class=\"data row9 col0\" >Purpose_education</td>\n",
       "      <td id=\"T_7a8ae_row9_col1\" class=\"data row9 col1\" >0.000000</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_7a8ae_level0_row10\" class=\"row_heading level0 row10\" >10</th>\n",
       "      <td id=\"T_7a8ae_row10_col0\" class=\"data row10 col0\" >Purpose_domestic_appliances</td>\n",
       "      <td id=\"T_7a8ae_row10_col1\" class=\"data row10 col1\" >0.000000</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_7a8ae_level0_row11\" class=\"row_heading level0 row11\" >11</th>\n",
       "      <td id=\"T_7a8ae_row11_col0\" class=\"data row11 col0\" >Purpose_car</td>\n",
       "      <td id=\"T_7a8ae_row11_col1\" class=\"data row11 col1\" >0.000000</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_7a8ae_level0_row12\" class=\"row_heading level0 row12\" >12</th>\n",
       "      <td id=\"T_7a8ae_row12_col0\" class=\"data row12 col0\" >Purpose_business</td>\n",
       "      <td id=\"T_7a8ae_row12_col1\" class=\"data row12 col1\" >0.000000</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_7a8ae_level0_row13\" class=\"row_heading level0 row13\" >13</th>\n",
       "      <td id=\"T_7a8ae_row13_col0\" class=\"data row13 col0\" >Checking_account_rich</td>\n",
       "      <td id=\"T_7a8ae_row13_col1\" class=\"data row13 col1\" >0.000000</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_7a8ae_level0_row14\" class=\"row_heading level0 row14\" >14</th>\n",
       "      <td id=\"T_7a8ae_row14_col0\" class=\"data row14 col0\" >Checking_account_none</td>\n",
       "      <td id=\"T_7a8ae_row14_col1\" class=\"data row14 col1\" >0.000000</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_7a8ae_level0_row15\" class=\"row_heading level0 row15\" >15</th>\n",
       "      <td id=\"T_7a8ae_row15_col0\" class=\"data row15 col0\" >Checking_account_moderate</td>\n",
       "      <td id=\"T_7a8ae_row15_col1\" class=\"data row15 col1\" >0.000000</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_7a8ae_level0_row16\" class=\"row_heading level0 row16\" >16</th>\n",
       "      <td id=\"T_7a8ae_row16_col0\" class=\"data row16 col0\" >Saving_accounts_none</td>\n",
       "      <td id=\"T_7a8ae_row16_col1\" class=\"data row16 col1\" >0.000000</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_7a8ae_level0_row17\" class=\"row_heading level0 row17\" >17</th>\n",
       "      <td id=\"T_7a8ae_row17_col0\" class=\"data row17 col0\" >Saving_accounts_quite_rich</td>\n",
       "      <td id=\"T_7a8ae_row17_col1\" class=\"data row17 col1\" >0.000000</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_7a8ae_level0_row18\" class=\"row_heading level0 row18\" >18</th>\n",
       "      <td id=\"T_7a8ae_row18_col0\" class=\"data row18 col0\" >Credit_amount</td>\n",
       "      <td id=\"T_7a8ae_row18_col1\" class=\"data row18 col1\" >0.000000</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_7a8ae_level0_row19\" class=\"row_heading level0 row19\" >19</th>\n",
       "      <td id=\"T_7a8ae_row19_col0\" class=\"data row19 col0\" >Saving_accounts_moderate</td>\n",
       "      <td id=\"T_7a8ae_row19_col1\" class=\"data row19 col1\" >0.000000</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_7a8ae_level0_row20\" class=\"row_heading level0 row20\" >20</th>\n",
       "      <td id=\"T_7a8ae_row20_col0\" class=\"data row20 col0\" >Saving_accounts_little</td>\n",
       "      <td id=\"T_7a8ae_row20_col1\" class=\"data row20 col1\" >0.000000</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_7a8ae_level0_row21\" class=\"row_heading level0 row21\" >21</th>\n",
       "      <td id=\"T_7a8ae_row21_col0\" class=\"data row21 col0\" >Housing_rent</td>\n",
       "      <td id=\"T_7a8ae_row21_col1\" class=\"data row21 col1\" >0.000000</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_7a8ae_level0_row22\" class=\"row_heading level0 row22\" >22</th>\n",
       "      <td id=\"T_7a8ae_row22_col0\" class=\"data row22 col0\" >Housing_free</td>\n",
       "      <td id=\"T_7a8ae_row22_col1\" class=\"data row22 col1\" >0.000000</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_7a8ae_level0_row23\" class=\"row_heading level0 row23\" >23</th>\n",
       "      <td id=\"T_7a8ae_row23_col0\" class=\"data row23 col0\" >Job_unskilled_resident</td>\n",
       "      <td id=\"T_7a8ae_row23_col1\" class=\"data row23 col1\" >0.000000</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_7a8ae_level0_row24\" class=\"row_heading level0 row24\" >24</th>\n",
       "      <td id=\"T_7a8ae_row24_col0\" class=\"data row24 col0\" >Job_unskilled_nonresident</td>\n",
       "      <td id=\"T_7a8ae_row24_col1\" class=\"data row24 col1\" >0.000000</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_7a8ae_level0_row25\" class=\"row_heading level0 row25\" >25</th>\n",
       "      <td id=\"T_7a8ae_row25_col0\" class=\"data row25 col0\" >Job_skilled</td>\n",
       "      <td id=\"T_7a8ae_row25_col1\" class=\"data row25 col1\" >0.000000</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_7a8ae_level0_row26\" class=\"row_heading level0 row26\" >26</th>\n",
       "      <td id=\"T_7a8ae_row26_col0\" class=\"data row26 col0\" >Job_highlyskilled</td>\n",
       "      <td id=\"T_7a8ae_row26_col1\" class=\"data row26 col1\" >0.000000</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_7a8ae_level0_row27\" class=\"row_heading level0 row27\" >27</th>\n",
       "      <td id=\"T_7a8ae_row27_col0\" class=\"data row27 col0\" >Sex_male</td>\n",
       "      <td id=\"T_7a8ae_row27_col1\" class=\"data row27 col1\" >0.000000</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_7a8ae_level0_row28\" class=\"row_heading level0 row28\" >28</th>\n",
       "      <td id=\"T_7a8ae_row28_col0\" class=\"data row28 col0\" >Purpose_vacation_others</td>\n",
       "      <td id=\"T_7a8ae_row28_col1\" class=\"data row28 col1\" >0.000000</td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>\n",
       "   "
      ],
      "text/plain": [
       "<IPython.core.display.HTML object>"
      ]
     },
     "metadata": {},
     "output_type": "display_data"
    }
   ],
   "source": [
    "display_side_by_side(agg_explainer.last_explanation_components, captions=['LIME explanation:', 'SHAP explanation:', 'Anchor explanation:'])"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "# Evaluating the aggregate explainer"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "### The ExplanationModelEvaluator Class\n",
    "This class holds all definitions for the metrics used to evaluate the explanation models. The aggregate explainer maintains an instance of this class in order to use its evaluations in the aggregation process. It is designed so that it can be used on any explainer that follows the interface and behavior conventions of the `explainers.py` file."
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "### Using the internal ExplanationModelEvaluator instance\n",
    "In order to be used, the ExplanationModelEvaluator class must be instantiated and its `init()` method must be called. This process, however, is somewhat time-consuming, since one of the metrics defined by this class relies on generating a noisy variation of the training data, and, to do that, an autoencoder is trained with tensorflow.\n",
    "\n",
    "However, this is usually not necessary, since the AggregateExplainer class maintains its own instance of the ExplanationModelEvaluator class, which can be used normally."
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 12,
   "metadata": {},
   "outputs": [],
   "source": [
    "# ++ Usual instantiation of the ExplanationModelEvaluator class:\n",
    "#\n",
    "# evaluator = ExplanationModelEvaluator(clf, X_train, categorical_features)\n",
    "# evaluator.init()    # Takes some time to train the autoencoder\n",
    "\n",
    "# ++ Or, grab the one maintained by the AggregatedExplainer:\n",
    "evaluator = agg_explainer.xai_evaluator"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "### [WORKAROUND] Applying the sensitivity metric to the aggregate explainer:\n",
    "One of the metrics defined in the ExplanationModelEvaluator class is the sensitivity metric. The way it works requires it to create several new instances of the explanation model being evaluated, since they each need to be fit to a different noisy variation of the training data. This process is very slow, and therefore multiprocessing is used in the `sensitivity()` function to distribute the workload. This, however, poses an issue when evaluating the sensitivity of the aggregate explainer model, since it may also use the sensitivity metric itself to perform the aggregation, which means a child process would have to create another child process, which usually is not allowed.\n",
    "\n",
    "As of now, in order to apply the sensitivity metric to the aggregate explainer, you must use a variation of its implementation that does the calculation without multiprocessing. A sequential version of the `sensitivity()` metric is provided by the `_sensitivity_sequential()` function."
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/plain": [
       "0.9400656814449916"
      ]
     },
     "execution_count": 8,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "evaluator._sensitivity_sequential(\n",
    "    agg_explainer, \n",
    "    X_test.iloc[sample_idx],\n",
    "    extra_explainer_params={    # Must specify everything the explainer needs to be instantiated\n",
    "        \"explainer_types\": [LimeWrapper, ShapTabularTreeWrapper, AnchorWrapper],\n",
    "        \"evaluator\": agg_explainer.xai_evaluator # Remember to resue the same evaluator instance, otherwise the autoencoder will be retrained for every iteration\n",
    "    },\n",
    "    iterations=3,\n",
    ")"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "### Full evalution of the aggregate explainer"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "Here's one way of evaluating the aggregate explainer and comparing it to the explainers whose explanations were aggregated. In this example, the aggregate explainer was evaluated with the same metrics it used to internally evaluate each of the component models. The `get_last_explanation_info()` function was used to retrieve the metrics that were calculated internally, so they aren't calculated twice."
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 15,
   "metadata": {},
   "outputs": [],
   "source": [
    "faithfulness = evaluator.faithfullness_correlation(agg_explainer, X_test.iloc[sample_idx])\n",
    "sensitivity = evaluator._sensitivity_sequential( # sequential version of sensitivity must be used at this time\n",
    "                                                agg_explainer, X_test.iloc[sample_idx],\n",
    "                                                extra_explainer_params={\n",
    "                                                    \"explainer_types\": [LimeWrapper, ShapTabularTreeWrapper, AnchorWrapper],\n",
    "                                                    \"evaluator\": agg_explainer.xai_evaluator\n",
    "                                                },\n",
    "                                                iterations=10\n",
    "                                            )\n",
    "nrc = evaluator.nrc(agg_explainer, X_test.iloc[sample_idx])\n",
    "\n",
    "metrics = agg_explainer.get_last_explanation_info().drop(columns='weight')\n",
    "\n",
    "metrics.at[AggregatedExplainer.__name__, 'faithfulness_corr'] = faithfulness\n",
    "metrics.at[AggregatedExplainer.__name__, 'sensitivity_spearman'] = sensitivity\n",
    "metrics.at[AggregatedExplainer.__name__, 'nrc'] = nrc"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 16,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/html": [
       "<div>\n",
       "<style scoped>\n",
       "    .dataframe tbody tr th:only-of-type {\n",
       "        vertical-align: middle;\n",
       "    }\n",
       "\n",
       "    .dataframe tbody tr th {\n",
       "        vertical-align: top;\n",
       "    }\n",
       "\n",
       "    .dataframe thead th {\n",
       "        text-align: right;\n",
       "    }\n",
       "</style>\n",
       "<table border=\"1\" class=\"dataframe\">\n",
       "  <thead>\n",
       "    <tr style=\"text-align: right;\">\n",
       "      <th></th>\n",
       "      <th>nrc</th>\n",
       "      <th>sensitivity_spearman</th>\n",
       "      <th>faithfulness_corr</th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <th>LimeWrapper</th>\n",
       "      <td>46.152620</td>\n",
       "      <td>0.859212</td>\n",
       "      <td>0.355147</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>ShapTabularTreeWrapper</th>\n",
       "      <td>42.648201</td>\n",
       "      <td>0.954843</td>\n",
       "      <td>0.154678</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>AnchorWrapper</th>\n",
       "      <td>18.442814</td>\n",
       "      <td>0.668667</td>\n",
       "      <td>0.079319</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>AggregatedExplainer</th>\n",
       "      <td>44.579487</td>\n",
       "      <td>0.913744</td>\n",
       "      <td>0.320685</td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>\n",
       "</div>"
      ],
      "text/plain": [
       "                              nrc  sensitivity_spearman  faithfulness_corr\n",
       "LimeWrapper             46.152620              0.859212           0.355147\n",
       "ShapTabularTreeWrapper  42.648201              0.954843           0.154678\n",
       "AnchorWrapper           18.442814              0.668667           0.079319\n",
       "AggregatedExplainer     44.579487              0.913744           0.320685"
      ]
     },
     "execution_count": 16,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "metrics"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "#### Using the `xai_agg.exp_utils.evaluate_aggregate_explainer()` function\n",
    "Utility function to evaluate the aggregate explainer, varying its settings. For each of the aggregate explainer's parameters (explainer components, mcdm algorighm, aggregation algorithm), the function accepts a list of possible values; it'll iterate over every possible value combination, checking n_instances, and will return the results as a list of lists of dataframes, one dataframe for each instance check, and one list of dataframes for each setting configuration."
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {},
   "outputs": [],
   "source": [
    "from xai_agg.exp_utils import evaluate_aggregate_explainer\n",
    "\n",
    "results, metadata = evaluate_aggregate_explainer(\n",
    "    clf, X_train, X_test, categorical_features,                                         # Model and data\n",
    "    explainer_components_sets=[[LimeWrapper, ShapTabularTreeWrapper, AnchorWrapper]],   # Wrapped explainer sets to be tested\n",
    "    mcdm_algs=[pymcdm.methods.TOPSIS()],                                                # MCDM algorithms to be tested\n",
    "    aggregation_algs=[\"wsum\"],                                                          # Aggregation algorithms to be tested\n",
    "    metrics_sets=[['nrc', 'sensitivity_spearman', 'faithfulness_corr']],                # Metric sets to be tested\n",
    "    n_instances=1,                                                                      # Number of instances per setting to run the evaluation on\n",
    "    mp_jobs=5                                                                           # Number of jobs to run in parallel (DECREASE THIS VALUE WHEN LOW RAM IS AVAILABLE)\n",
    ")"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 9,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/plain": [
       "[[                              nrc  sensitivity_spearman  faithfulness_corr\n",
       "  LimeWrapper             45.304455              0.838916           0.182748\n",
       "  ShapTabularTreeWrapper  44.518230              1.000000           0.240986\n",
       "  AnchorWrapper           35.929599              0.616926           0.326659\n",
       "  AggregateExplainer      48.324269              0.881232           0.286450]]"
      ]
     },
     "metadata": {},
     "output_type": "display_data"
    },
    {
     "data": {
      "text/plain": [
       "{'indexes': array([110]),\n",
       " 'configs': [{'explainer_components': [xai_agg.explainers.LimeWrapper,\n",
       "    xai_agg.explainers.ShapTabularTreeWrapper,\n",
       "    xai_agg.explainers.AnchorWrapper],\n",
       "   'metrics': ['nrc', 'sensitivity_spearman', 'faithfulness_corr'],\n",
       "   'mcdm_alg': <pymcdm.methods.topsis.TOPSIS at 0x7becc43bf9a0>,\n",
       "   'aggregation_alg': 'wsum'}]}"
      ]
     },
     "metadata": {},
     "output_type": "display_data"
    }
   ],
   "source": [
    "experiment_run = ExperimentRun(metadata, results)\n",
    "\n",
    "display(experiment_run.results)\n",
    "display(experiment_run.metadata)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 10,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/html": [
       "<div>\n",
       "<style scoped>\n",
       "    .dataframe tbody tr th:only-of-type {\n",
       "        vertical-align: middle;\n",
       "    }\n",
       "\n",
       "    .dataframe tbody tr th {\n",
       "        vertical-align: top;\n",
       "    }\n",
       "\n",
       "    .dataframe thead th {\n",
       "        text-align: right;\n",
       "    }\n",
       "</style>\n",
       "<table border=\"1\" class=\"dataframe\">\n",
       "  <thead>\n",
       "    <tr style=\"text-align: right;\">\n",
       "      <th></th>\n",
       "      <th>nrc</th>\n",
       "      <th>sensitivity_spearman</th>\n",
       "      <th>faithfulness_corr</th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <th>AggregateExplainer</th>\n",
       "      <td>48.324269</td>\n",
       "      <td>0.881232</td>\n",
       "      <td>0.286450</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>AnchorWrapper</th>\n",
       "      <td>35.929599</td>\n",
       "      <td>0.616926</td>\n",
       "      <td>0.326659</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>LimeWrapper</th>\n",
       "      <td>45.304455</td>\n",
       "      <td>0.838916</td>\n",
       "      <td>0.182748</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>ShapTabularTreeWrapper</th>\n",
       "      <td>44.518230</td>\n",
       "      <td>1.000000</td>\n",
       "      <td>0.240986</td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>\n",
       "</div>"
      ],
      "text/plain": [
       "                              nrc  sensitivity_spearman  faithfulness_corr\n",
       "AggregateExplainer      48.324269              0.881232           0.286450\n",
       "AnchorWrapper           35.929599              0.616926           0.326659\n",
       "LimeWrapper             45.304455              0.838916           0.182748\n",
       "ShapTabularTreeWrapper  44.518230              1.000000           0.240986"
      ]
     },
     "execution_count": 10,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "# Get mean results for a specific setting:\n",
    "\n",
    "desired_setting = 0\n",
    "get_expconfig_mean_results(experiment_run, desired_setting)"
   ]
  }
 ],
 "metadata": {
  "kernelspec": {
   "display_name": "Python 3",
   "language": "python",
   "name": "python3"
  },
  "language_info": {
   "codemirror_mode": {
    "name": "ipython",
    "version": 3
   },
   "file_extension": ".py",
   "mimetype": "text/x-python",
   "name": "python",
   "nbconvert_exporter": "python",
   "pygments_lexer": "ipython3",
   "version": "3.10.12"
  }
 },
 "nbformat": 4,
 "nbformat_minor": 2
}