import os
import shutil

import numpy as np
import torch
import torch.nn as nn
from torch.optim.lr_scheduler import StepLR
from torch.utils.tensorboard.writer import SummaryWriter

# import torchio as tio

# scheduler = StepLR(optimizer, step_size=5, gamma=0.1)
dict_class_names = {"hi_source": ["background", "galaxy"]}


def random_mask(input_tensor, mask_prob=0.2):
    """
    对输入张量进行随机遮掩。

    :param input_tensor: 输入的图像张量
    :param mask_prob: 每个像素被遮掩的概率
    :return: 随机遮掩后的输入张量
    """
    # 获取输入的形状
    batch_size, channels, fre, height, width = input_tensor.size()

    # 随机生成一个与输入图像相同大小的mask，0表示遮掩，1表示保留
    mask = (
        torch.rand(batch_size, channels, fre, height, width).cuda() < mask_prob
    )  # 用概率生成mask

    # 创建一个与输入图像相同形状的张量，用来填充遮掩区域
    mask_value = 0  # 可以选择替换为其他值（如均值）

    # 使用mask来遮掩输入张量
    input_tensor[mask] = mask_value  # 这里用0来遮掩输入区域
    return input_tensor


class TensorboardWriter:
    def __init__(self, args):
        name_model = args.log_dir + args.model + "_" + args.dataset_name
        self.writer = SummaryWriter(
            log_dir=args.log_dir + name_model, comment=name_model
        )
        if os.path.exists(args.save):
            shutil.rmtree(args.save)
            os.mkdir(args.save)
        else:
            os.makedirs(args.save)
        self.csv_train, self.csv_val = self.create_stats_files(args.save)
        self.dataset_name = args.dataset_name
        self.classes = args.classes
        self.label_names = dict_class_names[args.dataset_name]

        self.data = self.create_data_structure()

    def create_data_structure(
        self,
    ):
        data = {
            "train": dict((label, 0.0) for label in self.label_names),
            "val": dict((label, 0.0) for label in self.label_names),
        }
        data["train"]["loss"] = 0.0
        data["val"]["loss"] = 0.0
        data["train"]["count"] = 1.0
        data["val"]["count"] = 1.0
        data["train"]["dsc"] = 0.0
        data["val"]["dsc"] = 0.0
        return data

    def display_terminal(self, iter, epoch, mode="train", summary=False):
        """

        :param iter: iteration or partial epoch
        :param epoch: epoch of training
        :param loss: any loss numpy
        :param mode: train or val ( for training and validation)
        :param summary: to print total statistics at the end of epoch
        """
        if summary:
            info_print = (
                "\nSummary {} Epoch {:2d}:  Loss:{:.4f} \t DSC:{:.4f}  ".format(
                    mode,
                    epoch,
                    self.data[mode]["loss"] / self.data[mode]["count"],
                    self.data[mode]["dsc"] / self.data[mode]["count"],
                )
            )

            for i in range(len(self.label_names)):
                info_print += "\t{} : {:.4f}".format(
                    self.label_names[i],
                    self.data[mode][self.label_names[i]] / self.data[mode]["count"],
                )

            print(info_print)
        else:
            info_print = "\nEpoch: {:.2f} Loss:{:.4f} \t DSC:{:.4f}".format(
                iter,
                self.data[mode]["loss"] / self.data[mode]["count"],
                self.data[mode]["dsc"] / self.data[mode]["count"],
            )

            for i in range(len(self.label_names)):
                info_print += "\t{}:{:.4f}".format(
                    self.label_names[i],
                    self.data[mode][self.label_names[i]] / self.data[mode]["count"],
                )
            print(info_print)

    def create_stats_files(self, path):
        train_f = open(os.path.join(path, "train.csv"), "w")
        val_f = open(os.path.join(path, "val.csv"), "w")
        return train_f, val_f

    def reset(self, mode):
        self.data[mode]["dsc"] = 0.0
        self.data[mode]["loss"] = 0.0
        self.data[mode]["count"] = 1
        for i in range(len(self.label_names)):
            self.data[mode][self.label_names[i]] = 0.0

    def update_scores(self, iter, loss, channel_score, mode, writer_step):
        """
        :param iter: iteration or partial epoch
        :param loss: any loss torch.tensor.item()
        :param channel_score: per channel score or dice coef
        :param mode: train or val ( for training and validation)
        :param writer_step: tensorboard writer step
        """
        # WARNING ASSUMING THAT CHANNELS IN SAME ORDER AS DICTIONARY

        dice_coeff = np.mean(channel_score) * 100

        self.data[mode]["dsc"] += dice_coeff
        self.data[mode]["loss"] += loss
        self.data[mode]["count"] = iter + 1

        # for i in range(num_channels):
        #     self.data[mode][self.label_names[i]] += channel_score[i]
        #     if self.writer is not None:
        #         self.writer.add_scalar(mode + '/' + self.label_names[i], channel_score[i], global_step=writer_step)

    def write_end_of_epoch(self, epoch):
        self.writer.add_scalars(
            "DSC/",
            {
                "train": self.data["train"]["dsc"] / self.data["train"]["count"],
                "val": self.data["val"]["dsc"] / self.data["val"]["count"],
            },
            epoch,
        )
        self.writer.add_scalars(
            "Loss/",
            {
                "train": self.data["train"]["loss"] / self.data["train"]["count"],
                "val": self.data["val"]["loss"] / self.data["val"]["count"],
            },
            epoch,
        )
        for i in range(len(self.label_names)):
            self.writer.add_scalars(
                self.label_names[i],
                {
                    "train": self.data["train"][self.label_names[i]]
                    / self.data["train"]["count"],
                    "val": self.data["val"][self.label_names[i]]
                    / self.data["train"]["count"],
                },
                epoch,
            )

        train_csv_line = "Epoch:{:2d} Loss:{:.4f} DSC:{:.4f}".format(
            epoch,
            self.data["train"]["loss"] / self.data["train"]["count"],
            self.data["train"]["dsc"] / self.data["train"]["count"],
        )
        val_csv_line = "Epoch:{:2d} Loss:{:.4f} DSC:{:.4f}".format(
            epoch,
            self.data["val"]["loss"] / self.data["val"]["count"],
            self.data["val"]["dsc"] / self.data["val"]["count"],
        )
        self.csv_train.write(train_csv_line + "\n")
        self.csv_val.write(val_csv_line + "\n")


class Trainer:
    """
    Trainer class
    """

    def __init__(
        self,
        args,
        model,
        criterion,
        optimizer,
        train_data_loader,
        valid_data_loader=None,
        lr_scheduler=None,
        patience=5,
        min_delta=0,
        start_epoch=1,
    ):
        self.args = args
        self.model = model
        self.optimizer = optimizer
        self.criterion = criterion
        self.train_data_loader = train_data_loader
        # epoch-based training
        self.len_epoch = len(self.train_data_loader)
        self.valid_data_loader = valid_data_loader
        self.do_validation = self.valid_data_loader is not None
        self.lr_scheduler = lr_scheduler
        self.log_step = int(np.sqrt(train_data_loader.batch_size))
        self.writer = TensorboardWriter(args)
        self.mse_criterion = nn.MSELoss()  # 实例化 MSE 损失
        self.save_frequency = 10
        self.terminal_show_freq = self.args.terminal_show_freq
        self.start_epoch = start_epoch

        self.patience = patience
        self.min_delta = min_delta
        self.counter = 0
        self.best_loss = None
        self.early_stop = False

    #     self.transform = tio.Compose([
    #     tio.RandomAffine(scales=(0.8, 1.2), degrees=10),  # 随机缩放和旋转
    #     tio.RandomElasticDeformation(num_control_points=4, max_displacement=5),  # 弹性变形
    #     tio.RandomFlip(axes=('LR', 'AP', 'SI')),  # 随机翻转（左右、前后、上下）
    #     tio.RandomNoise(mean=0, std=0.1),  # 添加随机噪声
    #     tio.RandomBlur(std=(0.1, 0.5))  # 随机模糊
    # ])

    def training(self):
        for epoch in range(int(self.start_epoch), self.args.nEpochs):
            self.train_epoch(epoch)

            if self.do_validation:
                self.validate_epoch(epoch)
            scheduler = StepLR(self.optimizer, step_size=5, gamma=0.1)
            scheduler.step()
            val_loss = (
                self.writer.data["val"]["loss"] / self.writer.data["val"]["count"]
            )
            if self.args.save is not None and ((epoch + 1) % self.save_frequency):
                print("Saving checkpoint")
                self.model.save_checkpoint(
                    self.args.save, epoch, val_loss, optimizer=self.optimizer
                )

            self.writer.write_end_of_epoch(epoch)
            # save_to_file = [epoch,
            #     self.data['train']['loss']/self.data['train']['count'],
            #     self.data['train']['dsc'] / self.data['train']['count'],
            #     self.data['val']['loss'] / self.data['val']['count'],
            #     self.data['val']['dsc'] / self.data['val']['count']
            #     ]
            # with open(self.args.save + "/results.csv", 'a') as f:
            #     writer = csv.writer(f)
            #     writer.writerow(save_to_file)
            # Early stopping
            if self.best_loss is None:
                self.best_loss = val_loss
            elif self.best_loss - val_loss > self.min_delta:
                self.best_loss = val_loss
            elif self.best_loss - val_loss < self.min_delta:
                self.counter += 1
                print(
                    "INFO: Early stopping counter ", self.counter, " of ", self.patience
                )
                # if self.counter >= self.patience:
                #     print('INFO: Early stopping')
                #     break
            self.writer.reset("train")
            self.writer.reset("val")

    def train_epoch(self, epoch):
        self.model.train()
        ##### THIS IS THE MEMORY MONSTER!!!!!!!!!!!!!!
        for batch_idx, input_tuple in enumerate(self.train_data_loader):
            # print("\r", batch_idx, end="")
            self.optimizer.zero_grad()
            input_tensor, target, _ = input_tuple

            # target = target.squeeze(1).long()            # -> [B, D, H, W], dtype=long
            # target = F.one_hot(target, num_classes=2)
            # target = target.permute(0, 4, 1, 2, 3).float()

            if self.args.cuda:
                # print("Using GPU...")
                input_tensor, target = input_tensor.cuda(), target.cuda()
            # input_tensor.requires_grad = True
            # input_tensor = random_mask(input_tensor, mask_prob=0.2)
            with torch.autocast(device_type="cuda"):
                outputs = self.model(input_tensor)

                loss1 = self.criterion(outputs[0], target)
                # Assuming DiceLoss, per_ch_score is (1 - loss)
                per_ch_score = 1.0 - loss1.item()
            # loss2, _ = self.criterion(outputs[1], target)
            # total_loss = loss1 + loss2*0.5
            # total_loss.backward()

            # mse_loss = self.mse_criterion(outputs[0], input_tensor)
            # mse_loss.backward()

            # loss1 , per_ch_score= self.criterion(outputs[0], target)
            # loss2 = self.mse_criterion(outputs[1], input_tensor)
            # total_loss = loss1 + loss2*0.5

            # for output in outputs:
            # # target_np = target[0][0].numpy()
            # # if len(np.unique(target_np)) == 1:
            #     loss_dice, per_ch_score = self.criterion(output, target)
            #     total_loss += loss_dice
            # loss_dice= self.criterion(output, target)
            # per_ch_score=[0.0, 0.0]
            # loss_dice = self.criterion(output[:,1,:,:,:], target[:,0,:,:,:])
            scaler = torch.GradScaler()
            scaler.scale(loss1).backward()
            scaler.unscale_(self.optimizer)
            torch.nn.utils.clip_grad_norm_(self.model.parameters(), 1.0)
            # loss_dice.backward()
            print("train_loss", loss1.item())
            # self.optimizer.step()
            scaler.step(self.optimizer)
            scaler.update()
            # print(loss.item())
            self.writer.update_scores(
                batch_idx,
                loss1,
                per_ch_score,
                "train",
                epoch * self.len_epoch + batch_idx,
            )

            if (batch_idx + 1) % self.terminal_show_freq == 0:
                print(loss1.item())
                partial_epoch = epoch + batch_idx / self.len_epoch - 1
                self.writer.display_terminal(partial_epoch, epoch, "train")
                val_loss = (
                    self.writer.data["val"]["loss"] / self.writer.data["val"]["count"]
                )
                self.model.save_checkpoint(
                    self.args.save, partial_epoch, val_loss, optimizer=self.optimizer
                )

        self.writer.display_terminal(self.len_epoch, epoch, mode="train", summary=True)

    def validate_epoch(self, epoch):
        self.model.eval()

        assert self.valid_data_loader is not None
        for batch_idx, input_tuple in enumerate(self.valid_data_loader):
            with torch.no_grad():
                input_tensor, target, _ = input_tuple

                # target = target.squeeze(1).long()            # -> [B, D, H, W], dtype=long
                # target = F.one_hot(target, num_classes=2)
                # target = target.permute(0, 4, 1, 2, 3).float()

                if self.args.cuda:
                    # print("Using GPU...")
                    input_tensor, target = input_tensor.cuda(), target.cuda()
                # input_tensor.requires_grad = False
                # input_tensor = random_mask(input_tensor, mask_prob=0.2)  # 这里的0.2表示有20%的概率被遮掩
                # output = self.model(input_tensor)[0]
                outputs = self.model(input_tensor)
                # mse_loss = self.mse_criterion(outputs[0], input_tensor)
                loss1 = self.criterion(outputs[0], target)
                # Assuming DiceLoss, per_ch_score is (1 - loss)
                per_ch_score = 1.0 - loss1.item()
                # loss2, _ = self.criterion(outputs[1], target)
                # total_loss = loss1 + loss2*0.5
                # loss = self.criterion(output[:,1,:,:,:], target[:,0,:,:,:])
                # loss, per_ch_score = self.criterion(output, target)
                # loss= self.criterion(output, target)
                # print("val_loss",loss1.item())
                # per_ch_score=[0.0, 0.0]
                self.writer.update_scores(
                    batch_idx,
                    loss1.item(),
                    per_ch_score,
                    "val",
                    epoch * self.len_epoch + batch_idx,
                )

        assert self.valid_data_loader is not None
        self.writer.display_terminal(
            len(self.valid_data_loader), epoch, mode="val", summary=True
        )