use gamma matrix and enable random affine transformation (20854332) · Commits · Ding, Lijie / sheared_suspension

analyze/ML_analyze.py

0 → 100644

+439 −0

Original line number	Diff line number	Diff line
		import numpy as np
		import matplotlib.pyplot as plt
		from sklearn.gaussian_process import GaussianProcessRegressor
		from sklearn.gaussian_process.kernels import RBF, WhiteKernel
		import os
		from scipy.optimize import curve_fit
		import pickle


		def get_feature_SqSq2D_data(folder, parameters, random=False):

		all_N = [] # system size related
		all_theta, all_Sx, all_phi = [], [], [] # affine transformation parameters
		all_gamma_xx, all_gamma_xy, all_gamma_yx, all_gamma_yy = [], [], [], [] # affine transformation parameters
		#all_Sq2D = []
		#all_Sq2D_af = []
		all_SqSq2D_flatten = []
		all_finfo = []
		qD = []
		for i in range(len(parameters)):
		if random:
		n, run_num = parameters[i]
		finfo = f"{n:.0f}_random_run{run_num:.0f}"
		else:
		N, sigma, theta, Sx, phi = parameters[i]
		finfo = f"{N:.0f}_sigma{sigma:.1f}_theta{theta:.1f}_Sx{Sx:.1f}_phi{phi:.1f}"

		filename = f"{folder}/obs_{finfo}.csv"

		if not os.path.exists(filename):
		print(f"File not found: {filename}")
		continue
		data = np.genfromtxt(filename, delimiter=",", skip_header=1)
		bin_num = len(data[0]) - 10
		print(f"bin_num: {bin_num}")

		qD = data[1, 10:]
		Sq2D = data[2 : bin_num + 2, 10:]
		Sq2D_af = data[bin_num + 2 : 2 * bin_num + 2, 10:]
		SqSq2D = data[2 * bin_num + 2 : 3 * bin_num + 2, 10:]

		center = bin_num // 2
		mask_range = 5
		Sq2D[center - mask_range : center + mask_range + 1, center - mask_range : center + mask_range + 1] = 0
		Sq2D_af[center - mask_range : center + mask_range + 1, center - mask_range : center + mask_range + 1] = 0
		SqSq2D[center - mask_range : center + mask_range + 1, center - mask_range : center + mask_range +1] = 0

		all_SqSq2D_flatten.append(SqSq2D.flatten())

		n = data[0, 1]
		theta = data[0, 2]
		Sx = data[0, 3]
		phi = data[0, 5]
		gamma_xx = data[0, 6]
		gamma_xy = data[0, 7]
		gamma_yx = data[0, 8]
		gamma_yy = data[0, 9]

		all_N.append(n)
		all_theta.append(theta)
		all_Sx.append(Sx)
		all_phi.append(phi)

		all_gamma_xx.append(gamma_xx)
		all_gamma_xy.append(gamma_xy)
		all_gamma_yx.append(gamma_yx)
		all_gamma_yy.append(gamma_yy)

		all_finfo.append(finfo)

		all_feature = np.array([all_theta, all_Sx, all_phi, all_gamma_xx, all_gamma_xy, all_gamma_yx, all_gamma_yy]).T
		all_feature_name = ["theta", "Sx", "phi", "gamma_xx", "gamma_xy", "gamma_yx", "gamma_yy"]
		all_feature_tex = [r"$\theta$", r"$S_x$", r"$\phi$", r"$\gamma_{xx}$", r"$\gamma_{xy}$", r"$\gamma_{yx}$", r"$\gamma_{yy}$"]
		qD = np.array(qD)
		all_SqSq2D_flatten = np.array(all_SqSq2D_flatten)
		return all_feature, all_feature_name, all_feature_tex, all_SqSq2D_flatten, qD


		def calc_svd(folder, parameters):
		all_feature, all_feature_name, all_feature_tex, all_SqSq2D_flatten, qD = get_feature_SqSq2D_data(folder, parameters, random=True)

		print("all_feature shape:", np.array(all_feature).shape)
		svd = np.linalg.svd(all_SqSq2D_flatten)
		print(svd.S)
		print("np.array(svd.U).shape", np.array(svd.U).shape)
		print("np.array(svd.S).shape", np.array(svd.S).shape)
		print("np.array(svd.Vh).shape", np.array(svd.Vh).shape)
		# print(np.linalg.svd(all_Delta_Sq))

		plt.figure(figsize=(6, 6))
		# Subplot for svd.S
		ax00 = plt.subplot(2, 2, 1)
		ax00.plot(range(len(svd.S)), svd.S, "o--", markerfacecolor="none", label="svd.S")
		ax00.set_title("Singular Values (svd.S)")

		# Subplot for svd.U
		qDx, qDy = np.meshgrid(qD, qD)
		ax01 = plt.subplot(2, 2, 2)
		print("np.minimum(svd.Vh[0]), np.maximum(svd.Vh[0])", svd.Vh[0].min(), svd.Vh[0].max())
		ax01.contourf(qDx, qDy, svd.Vh[0].reshape(np.shape(qDx)), levels=np.linspace(-0.3, 0.2, 10), cmap="rainbow")
		ax01.set_title("Left Singular Vectors (svd.Vh[0])")

		ax11 = plt.subplot(2, 2, 3)
		print("np.minimum(svd.Vh[1]), np.maximum(svd.Vh[1])", svd.Vh[1].min(), svd.Vh[1].max())
		ax11.contourf(qDx, qDy, svd.Vh[1].reshape(np.shape(qDx)), levels=np.linspace(-0.3, 0.2, 10), cmap="rainbow")
		ax11.set_title("Left Singular Vectors (svd.Vh[1])")

		ax12 = plt.subplot(2, 2, 4)
		print("np.minimum(svd.Vh[2]), np.maximum(svd.Vh[2])", svd.Vh[2].min(), svd.Vh[2].max())
		ax12.contourf(qDx, qDy, svd.Vh[2].reshape(np.shape(qDx)), levels=np.linspace(-0.3, 0.2, 10), cmap="rainbow")
		ax12.set_title("Left Singular Vectors (svd.Vh[2])")

		plt.tight_layout()
		plt.savefig(f"{folder}/svd.png", dpi=300)
		plt.show()
		plt.close()

		SqV = np.inner(all_SqSq2D_flatten, np.transpose(svd.Vh))
		plt.figure()
		fig = plt.figure(figsize=(2 * len(all_feature_name), 8))
		axs = [fig.add_subplot(2, len(all_feature_name) // 2 + 1, i + 1, projection="3d") for i in range(len(all_feature_name))]
		for i in range(len(all_feature_name)):
		scatter = axs[i].scatter(SqV[:, 0], SqV[:, 1], SqV[:, 2], c=all_feature[:, i], cmap="jet_r", s=2)
		axs[i].set_xlabel("V[0]")
		axs[i].set_ylabel("V[1]")
		axs[i].set_zlabel("V[2]")
		axs[i].set_title(all_feature_name[i])
		axs[i].set_box_aspect([1, 1, 1]) # Set the aspect ratio of the plot
		# Set the same range for each axis
		max_range = np.array([SqV[:, 0].max() - SqV[:, 0].min(), SqV[:, 1].max() - SqV[:, 1].min(), SqV[:, 2].max() - SqV[:, 2].min()]).max() / 2.0
		mid_x = (SqV[:, 0].max() + SqV[:, 0].min()) * 0.5
		mid_y = (SqV[:, 1].max() + SqV[:, 1].min()) * 0.5
		mid_z = (SqV[:, 2].max() + SqV[:, 2].min()) * 0.5
		axs[i].set_xlim(mid_x - max_range, mid_x + max_range)
		axs[i].set_ylim(mid_y - max_range, mid_y + max_range)
		axs[i].set_zlim(mid_z - max_range, mid_z + max_range)
		cbar = fig.colorbar(scatter, ax=axs[i], fraction=0.02)
		cbar.set_label(all_feature_tex[i])
		axs[i].view_init(elev=10.0, azim=-30)

		plt.tight_layout()
		plt.savefig(f"{folder}/svd_projection_scatter_plot.png", dpi=300)
		plt.show()
		plt.close()

		# save these analyzed data for further easy plotting
		# svd data
		# data = np.column_stack((qDx.flatten(), svd.S, svd.Vh[0], svd.Vh[1], svd.Vh[2]))
		# column_names = ['qD', 'svd.S', 'svd.Vh[0]', 'svd.Vh[1]', 'svd.Vh[2]']
		# np.savetxt(f"{folder}/data_L{L}_svd.txt", data, delimiter=',', header=','.join(column_names), comments='')

		# svd projection data
		# save svd projection data
		data = np.column_stack((all_feature, SqV[:, 0], SqV[:, 1], SqV[:, 2]))
		column_names = all_feature_name + ["sqv[0]", "sqv[1]", "sqv[2]"]
		np.savetxt(f"{folder}/data_svd_projection.txt", data, delimiter=",", header=",".join(column_names), comments="")


		def calc_Sq_pair_distance_distribution(all_Delta_Sq, max_z, bin_num):
		all_z = np.linspace(0, max_z, bin_num)
		all_Delta_Sq_dis = np.zeros(bin_num)
		all_Delta_Sq_dis[0] = 1 / len(all_Delta_Sq) # for self distance

		for i in range(len(all_Delta_Sq) - 1):
		for j in range(i + 1, len(all_Delta_Sq)):
		Delta_Sq_dis = np.sqrt(np.sum(np.square(all_Delta_Sq[i] - all_Delta_Sq[j])))
		bin_index = int(Delta_Sq_dis / (max_z / bin_num))
		if bin_index >= bin_num:
		raise ValueError(f"bin_index >= bin_num, z={bin_index/bin_num*max_z}")
		all_Delta_Sq_dis[bin_index] += 2.0 / (len(all_Delta_Sq)) ** 2 / (max_z / bin_num) # 2.0 for i,j and j,i symmetry, normalize to 1

		return all_Delta_Sq_dis, all_z


		def calc_Sq_autocorrelation(mu, all_Delta_Sq, max_z, bin_num):
		# measure the autocorrelation of mu(Delta_Sq)
		all_z = np.linspace(0, max_z, bin_num)
		avg_mu = np.mean(mu)
		avg_mu2 = np.mean(np.square(mu))
		print("np.shape(mu)", np.shape(mu))
		print("np.shape(all_Delta_Sq)", np.shape(all_Delta_Sq))

		print("avg_mu:", avg_mu)
		print("avg_mu2:", avg_mu2)
		print("avg_mu2-avg_mu2:", avg_mu2 - avg_mu2)

		avg_mumuz = np.zeros(bin_num)
		avg_mu2z = np.zeros(bin_num)
		avg_muz = np.zeros(bin_num)

		# avg_mumuz[0] = avg_mu2 # for self distance
		# for i in range(len(all_Delta_Sq)-1):
		# for j in range(i+1, len(all_Delta_Sq)):
		bin_count = np.zeros(bin_num)
		for i in range(len(mu)):
		for j in range(len(mu)):
		Delta_Sq_dis = np.sqrt(np.sum(np.square(all_Delta_Sq[i] - all_Delta_Sq[j])))
		bin_index = int(Delta_Sq_dis / (max_z / bin_num))
		if bin_index >= bin_num:
		raise ValueError(f"bin_index >= bin_num, z={bin_index/bin_num*max_z}")
		avg_muz[bin_index] += mu[i]
		avg_mu2z[bin_index] += mu[i] * mu[i]
		avg_mumuz[bin_index] += mu[i] * mu[j]
		bin_count[bin_index] += 1
		for i in range(bin_num):
		avg_muz[i] /= bin_count[i]
		avg_mu2z[i] /= bin_count[i]
		avg_mumuz[i] /= bin_count[i]

		ac_mu = np.ones(bin_num)
		for i in range(0, bin_num):
		if avg_mu2 - avg_mu**2 == 0:
		ac_mu[i] = 1
		else:
		ac_mu[i] = (avg_mumuz[i] - avg_muz[i] 2) / (avg_mu2z[i] - avg_muz[i] 2)

		if ac_mu[0] != 1:
		print("ac_mu[0]!=1: ")
		print("avg_mumuz[0]-avg_muz[0]2,", avg_mumuz[0] - avg_muz[0] 2)
		print("(avg_mu2z[0]-avg_muz[0]2)", (avg_mu2z[0] - avg_muz[0] 2))
		print(bin_count)
		ac_mu[0] = 1
		print("ac_mu", ac_mu)
		return ac_mu, all_z


		def plot_pddf_acf(folder, parameters, max_z=2, n_bin=100):

		all_feature, all_feature_name, all_SqSq2D_flatten, qD = get_all_feature_Sq2D_data(folder, parameters)

		p_z, z = calc_Sq_pair_distance_distribution(all_SqSq2D_flatten, max_z, n_bin)

		plt.figure(figsize=(8, 6))
		plt.plot(z, p_z / np.max(p_z), label="p_z/max(p_z)")

		acf_data = []
		for i in range(len(all_feature_name)):
		# pass
		acf_mu, z = calc_Sq_autocorrelation(all_feature[:, i], all_SqSq2D_flatten, max_z, n_bin)
		plt.plot(z, acf_mu, label=f"acf_{all_feature_name[i]}")
		acf_data.append(acf_mu)

		plt.xlabel("z")
		plt.ylabel("Value")
		plt.title("Pair Distance Distribution and Autocorrelation")
		plt.legend()
		plt.savefig(f"{folder}/pddf_acf.png", dpi=300)
		plt.close()

		# save these data to file for futher easy plotting

		data = np.column_stack((z, p_z, *acf_data))
		column_names = ["z", "p_z", *["acf_" + feature_name for feature_name in all_feature_name]]
		np.savetxt(f"{folder}/data_pddf_acf.txt", data, delimiter=",", header=",".join(column_names), comments="")


		def GaussianProcess_optimization(folder, parameters_train):
		all_feature, all_feature_name, all_SqSq2D_flatten, qD = get_all_feature_Sq2D_data(folder, parameters_train)
		grid_size = 30

		theta_per_feature = {
		"kappa": (np.logspace(-1, 0, grid_size), np.logspace(-3, -2, grid_size)),
		# "f": (np.logspace(-1, 0, grid_size), np.logspace(-3, -2, grid_size)),
		# "gL": (np.logspace(-1, 0, grid_size), np.logspace(-3, -2, grid_size)),
		# "R2": (np.logspace(0, 0.5, grid_size), np.logspace(-5, -4, grid_size)),
		# "Rg2": (np.logspace(0.2, 0.4, grid_size), np.logspace(-7, -5, grid_size)),
		# "Sxz": (np.logspace(0.3, 0.6, grid_size), np.logspace(-7, -5, grid_size)), # to run
		}

		# feature normalization
		all_feature_mean = np.mean(all_feature, axis=0)
		all_feature_std = np.std(all_feature, axis=0)
		all_feature = (all_feature - all_feature_mean) / all_feature_std
		all_gp_per_feature = {}
		plt.figure()
		fig, axs = plt.subplots(1, len(all_feature_name), figsize=(6 * len(all_feature_name), 6))
		for feature_name, (theta0, theta1) in theta_per_feature.items():
		if feature_name not in all_feature_name:
		continue
		print("training: ", feature_name)
		feature_index = all_feature_name.index(feature_name)

		F_learn = all_SqSq2D_flatten

		# witout theta optimization
		kernel = RBF(1) + WhiteKernel(1)
		gp = GaussianProcessRegressor(kernel=kernel, alpha=0.0, optimizer=None).fit(F_learn, all_feature[:, feature_index])
		# print(" all_feature[:, feature_index]", all_feature[:, feature_index])

		print("GPML kernel: %s" % gp.kernel_)
		gp_theta = np.exp(gp.kernel_.theta)
		# kernel_params_array = np.array(list(kernel_params.values()))
		print("Kernel parameters:", gp_theta)
		print("Log-marginal-likelihood: %.3f" % gp.log_marginal_likelihood(gp.kernel_.theta))

		# calc Log likelihood
		ax = axs[all_feature_name.index(feature_name)]
		Theta0, Theta1 = np.meshgrid(theta0, theta1)
		LML = [[0 for j in range(Theta0.shape[1])] for i in range(Theta0.shape[0])]
		for i in range(Theta0.shape[0]):
		for j in range(Theta0.shape[1]):
		LML[i][j] = gp.log_marginal_likelihood(np.log([Theta0[i, j], Theta1[i, j]]))
		print(f"Calculating LML: i={i}/{Theta0.shape[0]}, j={j}/{Theta0.shape[1]}, LML={LML[i][j]}", end="\r")
		# reason for np.log here is the theta is log-transformed hyperparameters (https://github.com/scikit-learn/scikit-learn/blob/5491dc695/sklearn/gaussian_process/kernels.py#L1531) line (289)

		ax.contour(Theta0, Theta1, LML, levels=200)
		# find optimized theta0, theta1, using the above contour as guidanve
		kernel = RBF(theta0[grid_size // 2], (theta0[0], theta0[-1])) + WhiteKernel(theta1[grid_size // 2], (theta1[0], theta1[-1]))
		gp = GaussianProcessRegressor(kernel=kernel, alpha=0.0, n_restarts_optimizer=10).fit(F_learn, all_feature[:, feature_index])
		all_gp_per_feature[feature_name] = gp

		print("GPML kernel: %s" % gp.kernel_)
		gp_theta = np.exp(gp.kernel_.theta)
		# kernel_params_array = np.array(list(kernel_params.values()))
		print("Kernel parameters:", gp_theta)
		print("Log-marginal-likelihood: %.3f" % gp.log_marginal_likelihood(gp.kernel_.theta))

		ax.plot([gp_theta[0]], [gp_theta[1]], "x", color="red", markersize=10, markeredgewidth=2, label=r"l=%.2e, $\sigma$=%.2e" % (gp_theta[0], gp_theta[1]))

		ax.set_xscale("log")
		ax.set_yscale("log")
		ax.set_xlabel(r"theta0: l")
		ax.set_ylabel(r"theta1: $\sigma$")
		feature_name_legend = feature_name
		ax.set_title(f"Log Marginal Likelihood for {feature_name_legend}")
		ax.legend()

		data = np.column_stack(([gp_theta[0]] * len(theta0), [gp_theta[1]] * len(theta1), theta0, theta1, np.array(LML).T))
		column_names = ["gp_theta0", "gp_theta1", "theta0", "theta1", "LML"]
		np.savetxt(f"{folder}/data_{feature_name}_LML.txt", data, delimiter=",", header=",".join(column_names), comments="")
		with open(f"{folder}/gp_{feature_name}.pkl", "wb") as f:
		pickle.dump(gp, f)

		# Save average and standard deviation per feature
		avg_std_data = np.column_stack((all_feature_name, all_feature_mean, all_feature_std))
		column_names = ["Feature", "Mean", "Std"]
		np.savetxt(f"{folder}/data_feature_avg_std.txt", avg_std_data, delimiter=",", header=",".join(column_names), comments="", fmt="%s")

		plt.tight_layout()
		plt.savefig(f"{folder}/LML_subplots.png", dpi=300)
		# plt.show()
		plt.close()

		# return trained GPR
		return all_feature_mean, all_feature_std, all_gp_per_feature


		def read_gp_and_feature_stats(folder):
		all_feature_name = ["kappa", "f", "gL", "R2", "Rg2", "Sxx", "Syy", "Szz", "Sxy", "Sxz", "Syz"]
		all_feature_mean = np.genfromtxt(f"{folder}/data_feature_avg_std.txt", delimiter=",", skip_header=1, usecols=1)
		all_feature_std = np.genfromtxt(f"{folder}/data_feature_avg_std.txt", delimiter=",", skip_header=1, usecols=2)
		all_gp_per_feature = {}
		for feature_name in all_feature_name:
		if os.path.exists(f"{folder}/gp_{feature_name}.pkl"):
		with open(f"{folder}/gp_{feature_name}.pkl", "rb") as f:
		all_gp_per_feature[feature_name] = pickle.load(f)
		return all_feature_name, all_feature_mean, all_feature_std, all_gp_per_feature


		def GaussianProcess_prediction(folder, parameters_test, all_feature_mean, all_feature_std, all_gp_per_feature):
		all_feature, all_feature_name, all_SqSq2D_flatten, qD = get_all_feature_Sq2D_data(folder, parameters_test)

		plt.figure()

		fig, axs = plt.subplots(1, len(all_feature_name), figsize=(6 * len(all_feature_name), 6))
		for feature_name, gp in all_gp_per_feature.items():
		feature_index = all_feature_name.index(feature_name)
		Y = all_feature[:, feature_index]

		print("GPML kernel: %s" % gp.kernel_)
		gp_theta = np.exp(gp.kernel_.theta) # gp.kernel_.theta return log transformed theta
		# kernel_params_array = np.array(list(kernel_params.values()))
		print("Kernel parameters:", gp_theta)
		print("Log-marginal-likelihood: %.3f" % gp.log_marginal_likelihood(gp.kernel_.theta))

		Y_predict, Y_predict_err = gp.predict(all_SqSq2D_flatten, return_std=True)
		# print("np.shape(test_data[:, 0])", np.shape(test_data[:, 0]))
		print("np.shape(all_SqSq2D_flatten)", np.shape(all_SqSq2D_flatten))
		print("np.shape(Y_predict)", np.shape(Y_predict))

		Y_predict = Y_predict * all_feature_std[feature_index] + all_feature_mean[feature_index]
		Y_predict_err = Y_predict_err * all_feature_std[feature_index]

		axs[feature_index].errorbar(Y, Y_predict, yerr=Y_predict_err, marker="o", markerfacecolor="none", markersize=3, linestyle="none")
		axs[feature_index].plot(Y, Y, "--")
		min_val = min(np.min(Y), np.min(Y_predict - Y_predict_err))
		max_val = max(np.max(Y), np.max(Y_predict + Y_predict_err))
		axs[feature_index].set_xlim(min_val, max_val)
		axs[feature_index].set_ylim(min_val, max_val)
		axs[feature_index].set_xlabel(f"{feature_name}")
		axs[feature_index].set_ylabel(f"{feature_name} Prediction")

		# save data to file
		data = np.column_stack((Y, Y_predict, Y_predict_err))
		column_names = [feature_name, "ML predicted", "ML predicted uncertainty"]
		np.savetxt(f"{folder}/data_{feature_name}_prediction.txt", data, delimiter=",", header=",".join(column_names), comments="")

		plt.savefig(f"{folder}/prediction.png", dpi=300)
		plt.close()


		def ax_fit(x, a):
		return a * x


		def fit_Rg2(q, Sq):
		popt, pcov = curve_fit(ax_fit, q**2 / 3, (1 - Sq))
		perr = np.sqrt(np.diag(pcov))
		return popt[0], perr[0]


		def calc_Sq_fitted_Rg2(folder, parameters_test, all_feature_name):
		segment_type, all_feature, all_feature_name, all_Sq, all_Sq_err, q = read_Sq_data(folder, parameters_test)

		MC_Rg2 = all_feature[:, all_feature_name.index("Rg2")]
		# qfns = [10,20,30,40]
		qfns = [50, 55, 60, 65, 70]
		Rg2s = []
		Rg2_errs = []
		plt.figure()
		for qfn in qfns:
		Rg2s.append([])
		Rg2_errs.append([])
		for i in range(len(all_Sq)):
		Rg2, Rg2_err = fit_Rg2(q[:qfn], all_Sq[i][:qfn])
		Rg2s[-1].append(Rg2)
		Rg2_errs[-1].append(Rg2_err)

		plt.scatter(MC_Rg2, Rg2s[-1], alpha=0.5, label=f"qf={q[qfn-1]}")
		plt.plot(MC_Rg2, MC_Rg2, "k--")
		plt.xlabel("MC Rg2")
		plt.ylabel("Fitted Rg2")
		plt.legend()
		plt.savefig(f"{folder}/{segment_type}_Rg2_fit.png", dpi=300)
		plt.close()

		data = np.column_stack(([MC_Rg2] + Rg2s))
		column_names = ["MC Rg2", "fitted Rg2"]
		np.savetxt(f"{folder}/data_{segment_type}_fitted_Rg2.txt", data, delimiter=",", header=",".join(column_names), comments="")

analyze/main_ML_analyze.py

0 → 100755

+45 −0

Original line number	Diff line number	Diff line
		#!/opt/homebrew/bin/python3
		from plot_analyze import *
		import numpy as np
		from ML_analyze import *
		import sys
		import random
		import time


		def main():

		print("analyzing data using ML model")
		folder = "../data/20241101"
		rand_num = 1000
		rand_max = 1000
		parameters = []
		n = 200
		for i in range(rand_num):
		filename = f"{folder}/obs_{n}_random_run{i}.csv"
		if os.path.exists(filename):
		parameters.append([n, i])
		if len(parameters) >= rand_max:
		break
		print("parameters", parameters)
		print("total number of parameters", len(parameters))

		calc_svd(folder, parameters)

		return 0
		random.shuffle(parameters)
		parameters_train = parameters[: int(0.7 * len(parameters))]
		parameters_test = parameters[int(0.7 * len(parameters)) :]

		all_feature_mean, all_feature_std, all_gp_per_feature = GaussianProcess_optimization(folder, parameters_train)
		all_feature_names, all_feature_mean, all_feature_std, all_gp_per_feature = read_gp_and_feature_stats(folder)

		GaussianProcess_prediction(folder, parameters_test, all_feature_mean, all_feature_std, all_gp_per_feature)


		if __name__ == "__main__":
		start_time = time.time()
		main()
		end_time = time.time()
		execution_time = end_time - start_time
		print(f"Execution time: {execution_time} seconds")

analyze/main_analyze.py

+31 −28

Original line number	Diff line number	Diff line
		@@ -5,35 +5,38 @@ import os


		def main():
		#test_plot()

		if 1:
		folder = "../data/data_local/data_pool"
		N = 200
		N = 20
		parameters = [
		#[N, 0.0, 0.1, 0.9, 0.1],
		#[N, 0.0, 0.1, 0.9, 0.0],
		[N, 0.0, 0.1, 1.0, 0.0],
		[N, 0.0, 0.2, 1.0, 0.0],
		[N, 0.0, 0.0, 0.9, 0.0],
		[N, 0.0, 0.0, 0.8, 0.0],
		#[L, N, 1.0, 0.5, 0.5, 0.0],
		#[L, N, 0.0, 0.0, 1.0, 0.0],
		#[L, N, 0.0, 0.5, 1.0, 0.0],
		#[L, N, 1.0, 0.0, 1.0, 0.0],
		#[L, N, 1.0, 0.5, 1.0, 0.0],
		#[L, N, 0.5, 1.0, 0.0],
		#[L, N, 0.0, 2.0, 0.0],
		#[L, N, 0.0, 2.0, 0.5, 0.0],

		#[L, N, 0.0, 1.5, 1.0, 0.0],
		#[L, N, 0.0, 1.0, 1.5, 0.0],
		#[L, N, 0.0, 1.0, 1.0, 0.1],
		#[L, N, 0.0, 1.3, 1.0, 0.0],
		[N, 0.0, 1.00, 0.00, 0.00, 1.00],
		[N, 0.0, 1.00, 0.10, 0.00, 1.00],
		[N, 0.0, 1.00, 0.20, 0.00, 1.00],
		#[N, 0.0, 1.00, 0.20, 0.00, 1.00],
		#[N, 0.0, 1.00, 0.30, 0.00, 1.00],
		#[N, 0.0, 1.00, 1.00, 0.00, 1.00],
		#[N, 0.1, 1.00, 0.10, 0.00, 1.00],
		#[N, 1.0, 1.00, 0.10, 0.00, 1.00],
		]
		for parameter in parameters:
		N, sigma, theta, Sx, phi = parameter
		finfo = f"N{N:.0f}_sigma{sigma:.1f}_theta{theta:.1f}_Sx{Sx:.1f}_phi{phi:.1f}"
		N, sigma, gxx, gxy, gyx, gyy = parameter
		finfo = f"N{N:.0f}_sigma{sigma:.1f}_gxx{gxx:.2f}_gxy{gxy:.2f}_gyx{gyx:.2f}_gyy{gyy:.2f}"
		filename = folder + f"/config_{finfo}.csv"
		plot_gas_config(filename, finfo, show=True)
		# plot_gas_Sq_SqSq(folder, parameter, show=True)
		plot_gas_Iq_IqIq(folder, finfo, show=True)
		if 0:
		folder = "../data/data_local/data_pool"
		N = 200
		rand_num = 2
		for rnum in range(rand_num):
		finfo = f"N{N:.0f}_random_run{rnum}"
		filename = folder + f"/config_{finfo}.csv"
		plot_gas_config(filename, finfo, show=True)
		plot_gas_Sq_SqSq(folder, parameter, show=True)
		# plot_gas_Sq_SqSq(folder, parameter, show=True)
		plot_gas_Iq_IqIq(folder, finfo, show=True)


		if __name__ == "__main__":

analyze/plot_analyze.py

+190 −8

File changed.

Preview size limit exceeded, changes collapsed.

code/ideal_gas

+13.2 KiB (94 KiB)

File changed.

No diff preview for this file type.

View original file

View changed file